Meta lance une version "open source" du générateur de podcasts de Google
Meta vient de dévoiler une implémentation "open source" de la fonctionnalité virale de génération de podcasts présente dans NotebookLM de Google. Ce nouveau projet, baptisé NotebookLlama, s'appuie sans surprise sur les modèles Llama de Meta pour effectuer l'essentiel du traitement.
Une technologie inspirée de Google
À l'instar de NotebookLM, NotebookLlama peut générer des conversations de style podcast à partir de fichiers texte téléchargés sur la plateforme. Le processus se déroule en plusieurs étapes :
- Création d'une transcription à partir d'un fichier (PDF d'article de presse ou billet de blog)
- Ajout d'éléments de dramatisation et d'interruptions
- Conversion du texte en audio via des modèles de synthèse vocale open source
Des résultats perfectibles
Les premiers résultats ne rivalisent pas encore avec la qualité de NotebookLM. Les échantillons de NotebookLlama présentent des limitations évidentes :
- Voix clairement robotiques
- Tendance des voix à se chevaucher à des moments inappropriés
L'équipe de chercheurs de Meta reste optimiste quant aux possibilités d'amélioration. Ils identifient deux axes principaux de développement :
- Le perfectionnement des modèles de synthèse vocale
- L'évolution vers une approche impliquant deux agents IA débattant d'un sujet, plutôt qu'un modèle unique générant le contenu
Un défi persistant : les hallucinations
NotebookLlama n'est pas la première tentative de reproduire la fonctionnalité de podcast de NotebookLM. Bien que certains projets aient obtenu des résultats encourageants, tous se heurtent à un obstacle majeur : le phénomène d'hallucination propre à l'IA. En d'autres termes, les podcasts générés par intelligence artificielle contiennent inévitablement des éléments fictifs ou inexacts.
Cette initiative de Meta s'inscrit dans une tendance plus large de démocratisation des outils d'IA générative, tout en mettant en lumière les défis techniques qui restent à surmonter pour atteindre une qualité comparable aux productions humaines.
Github