Posted on: June 29, 2020 05:21 PM
Posted by: Renato
Categories: aws Transcribe
Views: 1255
Conversão de áudio para texto usando o AWS Transcribe and Sentiment Analysis usando a API Comprehend
É um serviço de reconhecimento automático de fala (SAR) da Amazon.
é capaz de reconhecer fala de
arquivos de áudio ou vídeo existentes ou de um fluxo de conteúdo de áudio ou vídeo e também de uma
entrada de áudio diretamente do microfone do seu computador.
O Amazon Transcribe usa tecnologias avançadas de aprendizado de máquina para reconhecer a fala em arquivos de áudio e transcrevê-las para o texto. Você pode usar o Amazon Transcribe para converter áudio em texto e criar aplicativos que incorporem o conteúdo de arquivos de áudio. Por exemplo, você pode transcrever a faixa de áudio. de uma gravação de vídeo para criar legendas ocultas para o vídeo.
Caso de uso da AWS
- Análise de voz
- Media Entretenimento
- Publicidade
- Conformidade da pesquisa
Que tipo de serviço é?
É um serviço de aplicativo totalmente gerenciado na pilha de aprendizado de máquina, você não precisa provisionar nenhum servidor ou gerenciar qualquer infraestrutura, basta fornecer o arquivo de origem através de um bucket S3 e obterá a saída transcrita do mesmo modo ou um balde diferente ou poderia estar em um balde que está sendo "de propriedade da amazon".
1. Amazon Transcribe
14 idiomas suportados para transcrição
- Árabe padrão moderno (ar SA) adicionado à lista de suporte recentemente em 28 de maio de 2019
- Inglês Australiano (en AU)
- Inglês Britânico (en GB)
- Inglês indiano (en IN) adicionado à lista de suporte recentemente em 15 de maio de 2019
- Inglês dos EUA (en EUA)
- Francês (fr FR)
- Francês canadense (fr CA)
- Alemão (de DE)
- Hindi indiano (hi IN) adicionado à lista de suporte recentemente em 15 de maio de 2019
- Italiano (IT)
- Coreano (ko KR)
- Português do Brasil (pt BR)
- Espanhol (es ES) adicionado recentemente à lista de suporte em 19 de abril de 2019
- US espanhol (es US)
11 Regiões suportadas
É suportado em 11 regiões para aqueles que não sabem o que é uma região da AWS, é basicamente um limite geográfico definido pela AWS e contém várias zonas de disponibilidade (conhecidas como data centers). Fornecer tolerância a falhas e recursos de balanceamento de carga para os serviços da AWS nessa região ou em várias regiões simultaneamente. sendo dito que nem todos os serviços lançados pela AWS foram disponibilizados em todas as regiões.
- Ásia-Pacífico (Sydney)
- Ásia-Pacífico (Cingapura)
- Ásia-Pacífico (Mumbai)
- Canadá (Central)
- UE (Irlanda)
- UE (Londres)
- UE (Paris)
- Leste dos EUA (Virgínia do Norte)
- Leste dos EUA (Ohio)
- Oeste dos EUA (Oregon)
- Oeste dos EUA (Califórnia)
Características principais
- Reconhecer vozes (identificar vários alto-falantes em um clipe de áudio)
- Transcrever canais de áudio separados (agente na L e cliente na R)
- Transcrição do streaming de áudio (som em tempo real para texto, por exemplo: microfone)
- Vocabulário personalizado (palavras personalizadas como: EC2, S3, nomes, termos do setor)
- Suporte para áudio de telefonia (a 8KHz com alta precisão)
- Geração de carimbo de data e hora e pontuação de confiança (carimbo de data e hora para cada palavra para localizá-la na gravação, juntamente com pontuação de confiança entre 0,00 e 1,0)
Especificação técnica de entrada de fala
Formatos suportados: • FLAC, MP3, MP4 ou WAV
Duração e tamanho suportados:
• Menos de 4 horas de duração ou menos de 2 Gb de dados de áudio
Você deve especificar o idioma e o formato do arquivo de entrada.
Para obter melhores resultados:
• Use um formato sem perdas, como FLAC ou WAV, com codificação PCM de 16 bits.
• Use uma taxa de amostragem de 8000 Hz para o áudio do telefone.
Você pode especificar que o Amazon Transcribe identifique entre 2 a 10 alto-falantes no clipe de áudio.
Especificação técnica de vocabulário personalizado
Um vocabulário personalizado é uma lista de palavras específicas que você deseja que o Amazon Transcribe reconheça na sua entrada de áudio. Geralmente, são palavras e frases específicas do domínio, palavras que o Amazon Transcribe não está reconhecendo ou nomes próprios.
Você pode ter até 100 vocabulários em sua conta. O limite de tamanho para um vocabulário personalizado é de 50 Kb. Você pode defini-lo em um formato de lista ou de tabela.
Referencia completa: https://medium.com/analytics-vidhya/converting-audio-to-text-using-aws-transcribe-and-finding-sentiment-using-comprehend-api-from-d692862e77d4
Referencia completa: https://github.com/federalst/Teste-pratico
Donate to Site
Renato
Developer
-
AndreSoada - há 3 anos
Legit bitcoin doubler site 2021: Double Your Bitcoin Instantly. If you want to double your bitcoin instantly, or looking for a legit bitcoin doubler site in 2021 to earn crypto, check this out. Click : https://bitdouble.net -
Williamphymn - há 3 anos
✨Premium Seller - 8 years old Twitter Account With less than 100 Followers For Just $31✨ dig this https://sellaccs.net PM Skype & Telegram : congmmo ICQ : @652720497 Email : accsmarket.net@gmail .com THX! -
TwitterCo-tah - há 3 anos
Bán Account Twitter cổ từ 2007 đến 2017 random follower dưới 100 giá 23k/accs. Giá có thể thay đổi theo thời điểm. http://accs.vn Liên hệ: Zalo : 0934670123 [email protected] Thank you! -
Geraldadmig - há 3 anos
2010 ??<HQ> AGED TWITTER ACCOUNT (2008-2019) ORIGINAL EMAIL INCLUDED INSTANT DELIVERY ?? Go At this site https://accstores.com Contact Skype & Telegram : congmmo ICQ : @652720497 Email : accsmarket.net@gmail .com Thanks You