Dados do Trabalho
Título
AVALIAÇAO DE SISTEMA DE REC. DE LOCUTOR EM UMA BASE DE VOZES DE GEMEOS IDENTICOS
Introdução
Um dos cenários forenses mais desafiadores na discriminação de indivíduos pela voz ocorre quando envolve a determinação da autoria entre gêmeos idênticos. Abordagens baseadas em SRAL têm sido agregadas às análises tradicionais2 e é avaliada a sua aplicabilidade neste cenário.
Objetivos
Avaliar o poder discriminativo de um sistema SRAL baseado no projeto Speechbrain, modelo ECAPATDNN treinado e avaliado nas bases Voxceleb 1 e 2, quando aplicado ao cenário descrito.
Parte experimental
Foram selecionadas duas amostras de fala em dois diferentes estilos, contendo 60s de duração de cada um dos falantes presentes na base de gêmeos2, segmentadas em trechos de 5s, 10s, 15s, 20s e 30s. Foram obtidos os escores de similaridade aplicando validação cruzada do tipo Leave-One-Out / Leave-Two-Out, modelados como funções de densidade de probabilidade (PDF) gaussianas para as hipóteses: H1 (mesma origem) e H2 (origens diferentes – restritas a irmãos gêmeos). A partir das distribuições, foram calculados os Log-Likelihood-Ratio Cost (CLLR) correspondentes.
Resultados e Discussões
A Tabela 1 sumariza os resultados obtidos onde pode ser observado que quanto maior o trecho da amostra de áudio utilizada, melhor é a discriminação do sistema, em linha com resultados publicados na literatura envolvendo sistemas SRAL aplicados a populações típicas de falantes3. Sistemas com CLLR abaixo de 1 são considerados potencialmente relevantes para o uso forense4.
Tabela 1. CLLR (R. Log. C10 + ELUB)
Cenário CLLR
12 x 5s 0.626
6 x 10s 0.519
4 x 15s 0.468
3 x 20s 0.438
2 x 30s 0.450
Conclusões
Os resultados indicam uma boa capacidade de discriminação de sistemas SRAL, mesmo quando utilizado em cenários desafiadores. Pretende-se estender esta análise à base de vozes envolvendo irmãos não gêmeos e avaliar a combinação de resultados envolvendo análises perceptuais e acústicas associadas a sistemas automáticos.
Referências e agradecimentos
Ravanelli, M., et al. Speechbrain: A generalpurpose speech toolkit. arXiv preprint arXiv:2106.04624, 2021.
Cavalcanti, J. C., et al. Multi-parametric analysis of speech timing in inter-talker identical twin pairs and cross-pair comparisons: Some forensic implications. Plos one 17, e0262800, 2022.
Weber P., et al. Validations of an alpha version of the E3 Forensic Speech Science System (E3FS3) core software tools.
Forensic Sci Int Synerg. 100223. doi: 10.1016/j.fsisyn.2022.100223. PMID: 35281657; PMCID: PMC8908042, 2022.
MORRISON GS et al., Science and Justice, v. 61. n. 3, p. 299-309, 2021.
Palavras Chave
Comparação de locutor, speechbrain, gêmeos.
Arquivos
Área
ICMedia
Autores
RONALDO RODRIGUES DA SILVA, JÚLIO CESAR CAVALCANTI, ANDERS ERIKSSON