Pastilla, darija, traditions : pourquoi l’IA ne comprend rien à la culture marocaine

Pastilla, darija, traditions : pourquoi l’IA ne comprend rien à la culture marocaine

Les outils d’intelligence artificielle censés comprendre le monde arabe peinent encore à saisir les spécificités marocaines. Pastilla, darija, habits traditionnels : autant d’éléments qui déroutent les algorithmes et se retrouvent déformés dans les descriptions générées. Une recherche récente a montré qu’une coiffe du nord du Maroc est par exemple identifiée comme un sombrero mexicain, tandis qu’un dessert omanais est présenté comme une pastilla.

Des chercheurs de l’université Mohammed Ben Zayed et du MIT ont testé plusieurs modèles linguistiques arabes et relevé des anomalies surprenantes. Un chameau est parfois pris pour une autruche, des gants traditionnels sont décrits comme des sacs, et les dialectes marocains sont confondus avec l’égyptien ou l’arabe littéraire. Ces confusions, expliquent‑ils, tiennent à des ensembles de données trop limités et à une annotation réalisée par des personnes peu familières avec la culture maghrébine.

Les spécialistes estiment qu’il est urgent d’enrichir les jeux de données avec des photos et des textes issus de toutes les régions du Maroc et de confier l’annotation à des locuteurs natifs. Sans cette diversification, les IA continueront de livrer une image erronée des traditions et de la langue marocaines. Les utilisateurs sont donc appelés à rester vigilants face aux résultats produits par ces outils et à signaler les biais afin de contribuer à leur amélioration.

Laisser un commentaire