Inteligência Artificial: Modelo ‘treinado’ por humanos é capaz de identificar com precisão o significado dos latidos dos cães
Um novo estudo revelou que um modelo de inteligência artificial (IA) treinado com dados humanos pode identificar com grande precisão o significado dos latidos dos cães. Esta descoberta intrigante foi apresentada na Conferência Internacional Conjunta sobre Linguística Computacional, Recursos Linguísticos e Avaliação.
Imagine ser capaz de compreender cada latido, lamento ou rosnado do seu cão. Este é o foco do estudo recente, que explora como a IA pode interpretar as vocalizações dos cães, distinguindo entre latidos de brincadeira e rosnados agressivos, e até identificando características como a idade, a raça e o sexo do cão.
A equipa de investigadores reuniu um conjunto de dados de latidos de 74 cães em Tepic e Puebla, no México, com idades entre os 5 e os 84 meses, e que eram predominantemente Chihuahuas, Caniches Franceses e Schnauzers. As gravações foram realizadas no ambiente doméstico natural dos cães para capturar respostas vocais autênticas.
Os cães foram expostos a vários estímulos destinados a provocar diferentes tipos de vocalizações, como a presença de um estranho, interações lúdicas e ataques simulados ao dono. As vocalizações foram captadas com uma câmara Sony CX405 Handycam e apenas os componentes áudio foram utilizados para análise.
Os clips de áudio foram segmentados em partes mais curtas e anotados manualmente com base no contexto em que ocorreram. Este processo resultou em 14 categorias distintas de vocalizações, como latidos muito agressivos para um estranho, latidos normais para um estranho e latidos de brincadeira durante jogos.
O núcleo da análise envolveu a utilização de um modelo sofisticado de IA conhecido como Wav2Vec2, inicialmente desenvolvido para o reconhecimento da fala humana. Os investigadores ajustaram este modelo com o seu conjunto de dados de vocalizações de cães, explorando tarefas como a identificação de cães individuais, a determinação da raça, a previsão do género e a ligação dos latidos aos seus contextos específicos, conforme relatado pelo PsyPost.
O modelo de IA demonstrou uma capacidade notável para reconhecer cães individuais com base nos seus latidos, atingindo uma precisão de quase 50%, em comparação com 24% para um modelo treinado apenas com vocalizações de cães. Este facto sugere que o pré-treino com discurso humano fornece uma base sólida para a compreensão das estruturas complexas das vocalizações dos animais.
Além disso, o modelo identificou com êxito a raça de um cão a partir do seu ladrar, com uma taxa de precisão de 62%. Este resultado implica que diferentes raças de cães possuem padrões vocais distintos, semelhantes aos sotaques no discurso humano. No entanto, prever o género de um cão com base nas suas vocalizações revelou-se mais difícil, indicando que as pistas vocais relacionadas com o género podem ser menos distintas.
Por último, o modelo de IA foi excelente na fundamentação dos latidos nos seus contextos específicos, diferenciando entre vários tipos de latidos. Este facto sublinha os benefícios da utilização do pré-treino da fala humana para compreender as vocalizações dos animais.
Embora os resultados do estudo sejam promissores, os investigadores sublinham a necessidade de incluir uma gama mais ampla de raças de cães e amostras mais diversificadas em pesquisas futuras. Isto garantirá que os modelos de IA possam generalizar de forma mais eficaz para diferentes populações caninas.
Este avanço representa um passo significativo na compreensão do comportamento e comunicação dos cães, potencialmente revolucionando a forma como interagimos com os nossos animais de estimação.