Ferret, le projet d’intelligence artificielle (IA) d’Apple, un modèle de langage multimodal innovant. Il pourrait améliorer ses outils, de Siri à Photos. Il rivalise avec Gemini de Google.
Ferret, un modèle de langage multimodal dévoilé en open source
L’année 2023 a été incontestablement marquée par l’essor de l’intelligence artificielle (IA). Toutefois, au milieu de cette effervescence, une société a maintenu un silence remarquable sur le sujet : Apple. En ce début d’année 2024, la firme à la pomme maintient son mutisme, mais des sources spécialisées américaines révèlent qu’à l’automne 2023, la firme de Cupertino aurait discrètement mis en ligne une version open source de son modèle de langage multimodal, baptisé Ferret. Ce dernier aurait été développé en collaboration avec l’Université de Cornell, dans l’État de New York, et serait accessible à tous via la plateforme GitHub. L’annonce, bien que tardive, soulève des questions sur les futurs développements de cette technologie au sein de l’écosystème de la marque à la pomme.
L’IA d’Apple, une avancée majeure pour le texte et l’image
Le projet d’IA d’Apple, Ferret, baptisé ainsi pour sa capacité à « fureter » simultanément dans les textes et les images, ouvre de nouvelles perspectives. Cette conception vise à identifier divers éléments lors de l’analyse de requêtes. Bien que la société siégée à Cupertino n’ait encore dévoilé aucun usage concret, des spéculations émergent sur l’intégration prochaine de ces recherches au sein des environnements Mac (via macOS) et iPhone / iPad (via iOS). L’enjeu semble être la création d’applications pratiques exploitant la compréhension conjointe du texte et de l’image, faisant ainsi de cette IA un atout potentiel dans l’évolution des produits de la compagnie.
Une intelligence artificielle qui va booster Siri et les photos
À son stade de maturité, le modèle de langage multimodal Ferret se profile comme un outil multifonction au sein de l’écosystème de la marque. En améliorant la compréhension contextuelle, cette innovation pourrait étendre les capacités de Siri, permettant ainsi des réponses plus précises à des requêtes complexes. Ses applications s’étendraient également à la reconnaissance et à l’organisation des photos, ainsi qu’à la génération de textes et d’images. Une dimension inclusive émerge avec la potentialité d’aider les personnes malvoyantes en décrivant des images ou des paysages. A l’aube de son déploiement, cette nouveauté s’annonce comme un pilier polyvalent au service de l’expérience utilisateur chez le géant de la tech.
La marque à la pomme compte dévoiler son innovation à la WWDC
En pleine ébullition d’innovation dans le domaine de l’intelligence artificielle, le développement de Ferret est encore à ses débuts. La société pourrait opter pour la prudence en différant les annonces officielles, réservant potentiellement la révélation des utilisations futures de Ferret pour sa conférence annuelle pour développeurs (WWDC), prévue en juin 2024. Cette stratégie, empreinte de suspense, souligne l’importance que la firme accorde à la présentation soignée de ses avancées technologiques, laissant entrevoir un moment propice où les potentialités de cette technologie seront dévoilées, faisant ainsi de la WWDC un rendez-vous clé pour les passionnés et les observateurs de l’univers de la firme.
Avec ETX / DailyUp