fbpx
Inteligência Artificial
Imagem de uma manada de elefantes africanos

CIO HartB integra ‘Elephant Listening Project Team 4’

Quando pensamos em Inteligência Artificial, há um universo de possibilidades para solucionar problemas, tornar processos mais eficientes e transformar o mundo de forma positiva, mas para atingir resultados reais com o desenvolvimento ágil da tecnologia, é preciso buscar atualização constante e uma visão ampla das suas aplicações.

Em seu processo contínuo de qualificação, Paulo Campos – CIO HartB, integrou o time ‘Elephant Listening Project Team 4’ no curso ‘AI: Cloud and Edge Implementations’ da Universidade de Oxford, aplicando a IA na análise de arquivos de áudio para realizar a contagem de elefantes selvagens em seu habitat, distinguindo-os com precisão através das particularidades em suas emissões de sons infrassônicos.

A solução em IA desenvolvida pelo time permite que especialistas analisem e compreendam o comportamento dos animais na natureza, algo extremamente útil no combate à caça esportiva e predatória, ameaças que contribuíram para que a população de elefantes africanos, que já foi de 1,3 milhões na década de 70 fosse reduzida a menos de 500 mil nos dias de hoje.

Para aplicar a IA na prática, atingindo o objetivo de contar o número de elefantes, o time precisou realizar uma série de operações com arquivos em formato Wave (.wav), e metadados que indicavam os segmentos onde provavelmente estavam as emissões, ou comunicação, dos animais.

Análise dos arquivos de áudio

Além de obter imagens 2D a partir dos sons disponíveis, é fundamental entender que os elefantes se comunicam com a emissão de sons em uma frequência típica de 10 a 50Hz, com duração entre 2 e 6 segundos, carregando variações harmônicas que permitem diferenciar os animais através da frequência de base da emissão.

Quando há duas emissões ligeiramente sobrepostas, ou separadas com uma frequência base diferente, provavelmente são de diferentes animais.

Fluxo da análise de dados

A análise segue etapas estruturadas em diferentes fases desde a entrada dos dados, passando pelo seu tratamento, até a obtenção do número de elefantes como resultado desejado.

Entendendo as etapas do fluxo

Segmentação dos dados: Com base nos arquivos de metadados, foram criados segmentos de alguns segundos, contendo as informações interessantes para a análise.

Espectrogramas: Cada segmento foi transformado em uma imagem 2D com tempo x frequência entre 10 e 50Hz, utilizando o algoritmo de transformação rápida de Fourier (FTT), e os filtros de frequência lowpass/highpass.

Redução de ruído: Cada espectrograma passou por redução de ruídos e foi transformado em uma imagem monocromática simples.

Detecção de contornos: As imagens simplificadas foram avaliadas com um algoritmo de detecção de contornos para distinguir os objetos separados, que neste caso, consistiam nas emissões dos elefantes.

Marcação: Para cada contorno (potencial emissão) calculamos a dimensão (altura e largura) traçando uma caixa ao redor do contorno.

Contagem: Comparamos as caixas que identificam as emissões em cada espectrograma e, com base em algumas regras, foram contados os diferentes elefantes em cada imagem.

Demonstração do fluxo de análise

Exemplo: 1 x 2 elefantes

Note que o primeiro gráfico mostra uma emissão em frequências diferentes, porém na mesma janela de tempo, indicando que a emissão pertence a um elefante, enquanto no gráfico seguinte, duas emissões se sobrepõe de forma parcial e com frequências base diferentes, determinando a existência de dois elefantes.

Apesar de parecer algo simples à primeira vista, a comunicação infrassônica entre os elefantes pode ser ‘ouvida’ mesmo a longas distâncias, e a contagem precisa do número de indivíduos faz da IA uma importante aliada no monitoramento da espécie e adoção de medidas para a sua proteção, por exemplo.

Conclusões

Após analisados 3935 sons, os resultados em relação aos espectrogramas indicaram que 112 não continham elefantes, 3277 continham apenas 1 elefante, 505 continham 2 elefantes e 40 continham 3 elefantes.

O algoritmo de marcação (boxing) foi avaliado por Liz Rowland, Universidade de Cornell, e a precisão reportada para o modelo foi de:

97,29% para a base de dados de treino (3180 casos) e 99,29% para a base de dados de teste (758 casos), índices que atestam a utilidade do modelo para a contagem de elefantes.

Assista ao vídeo com a apresentação projeto:

Perfil do CIO

Paulo Campos é um entusiasta da tecnologia com duas décadas de experiência em TI e tecnologias disruptivas, apaixonado pela busca por soluções com potencial para impactar o mundo de forma positiva com o uso inteligente dos dados. Sua trajetória de formação passa por instituições relevantes dentro e fora do Brasil, entre elas estão: PUC, University of Oxford, Duke University, IBM, The Open Group e Offensive Security.

Em sua atuação na HartB, Paulo Campos assume como missão a democratização do acesso a tecnologias de ponta como IA, machine learning e IoT, para empresas de todos os tamanhos, além de promover melhorias para a sociedade.

Confira o projeto no site da Microsoft https://bit.ly/3vm0OCp e conheça também o Elephant Listening Project.

Autor

Hartb

Inteligência humana gerando inteligência artificial.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *