Transcrição de áudio

Gerar a transcrição de uma gravação de áudio.

É possível consultar um modelo diretamente e testar os resultados de diferentes valores de parâmetros com o console do Cloud ou chamando a API Vertex AI diretamente.

Comando Freeform

Gerar uma transcrição do áudio, extrair apenas a fala e ignorar o áudio em segundo plano.

Resposta

Em todo o mundo, pessoas e organizações geram dados que podem ser extraordinariamente úteis. E acho que precisamos encontrar uma maneira de aproveitar isso para resolver problemas. O desafio é que muitos desses conjuntos de dados são muito fragmentados. A maioria dos desafios complexos da sociedade não é resolvida com uma única fonte de dados. Essa fragmentação dificulta o uso das informações do mundo para realmente fazer uma grande diferença para todas as pessoas em todos os lugares. A missão do Google é organizar e facilitar o acesso a todos os tipos de informação. Estamos fazendo isso agora com os dados públicos. Reunimos, padronizamos e processamos dados de dezenas de milhares de tabelas de centenas de fontes globais confiáveis e os colocamos em uma visualização facilmente compreensível. Essa é a parte divertida. Agora vem a IA e o processamento de linguagem natural. A maioria das pessoas não pensa em termos de gráficos de dispersão ou variáveis de interesse, pontos de dados ou triplos. Elas pensam em termos da pergunta que querem fazer aos dados. Agora imagine se você pudesse fazer a pergunta em inglês comum. Depois, você recebe esses gráficos que ajudam a conseguir insights e que permitem entender mais profundamente de maneiras sensatas. Essa capacidade de tornar os dados acessíveis, inteligentes, pragmáticos e práticos no nível da organização torna o Data Commons uma ferramenta essencial para as organizações no trabalho, na minha opinião. Agora, a IA generativa está por trás de algumas das funcionalidades mais importantes em dados comuns. Com modelos de linguagem grandes, é possível fazer perguntas e começar a receber respostas. Imagine, por exemplo, que sou uma ONG climática e estou tentando entender como o acesso à eletricidade mudou nos países da África. Eu pesquisaria sobre isso no Data Commons. Com esses gráficos, podemos notar que o Quênia, a Somália e o Gana tiveram os maiores aumentos no acesso à eletricidade. Eu me pergunto qual foi o impacto disso nas emissões de gases de efeito estufa deles. Com esses gráficos, vemos que as emissões de gases do efeito estufa em Gana aumentaram significativamente mais do que as do Quênia. Essas observações são o início de uma jornada para entendermos melhor como podemos aumentar o acesso a coisas como eletricidade sem aumentar proporcionalmente as emissões de gases do efeito estufa. Quando se trata de realmente agir com os insights desses dados, as pessoas vão tomar providências. Também temos que pensar nisso com responsabilidade. É por isso que fazer isso juntos e pensar em parcerias, colaborações, eu acho que é tão importante. São essas pessoas com profundo conhecimento do domínio, que sabem quais são as perguntas certas a fazer e quais são as soluções certas a criar. Na TechSoup, estamos trabalhando no mundo todo para conectar organizações sem fins lucrativos à tecnologia há mais de 30 anos. Os dados estão no centro do que as organizações precisam para conseguir fazer mudanças. Começamos a trabalhar com doações e bancos de alimentos nos Estados Unidos e com o Data Commons do Google para criar nossa própria instância de dados comuns que reuniu os pontos de dados e variáveis que seriam mais interessantes para esses tipos de organizações. Uma das grandes reclamações que recebemos com frequência sobre pequenas organizações é que elas não se arriscam. E é difícil correr riscos se você não tem dados porque eles estão operando em um mundo conhecido, certo? O mundo que elas veem nos dados, o que acaba reforçando a si mesmo. O Data Commons abre esse mundo para as organizações. Isso significa que elas podem correr um risco porque não estão correndo o risco cegamente. Nunca imaginei que veria isso durante a minha vida e é muito emocionante estar em uma época em que isso é realmente possível. As organizações sabem as perguntas que querem fazer sobre os dados. Eles têm o conhecimento que obtém nas respostas que serão significativas para eles. O Data Commons democratiza isso. Basta entrar e digitar a pergunta que você realmente precisa fazer. Isso é totalmente revolucionário.

Modelo: gemini-1.5-flash-002
Temperatura: 0,2
Máximo de tokens de saída: 8192
TopK: 40.0
TopP: 0,95