Google a introduit deux mises à jour majeures de son assistant Gemini AI :ToileetAperçu audio, élargissant les capacités de son IA pour inclure une collaboration de codage en temps réel et des résumés de style podcast générés par l’IA. Ces nouvelles fonctionnalités visent à améliorer la productivité, l’accessibilité et l’interaction des utilisateurs avec le contenu généré par l’IA, positionnant Gemini AI comme un concurrent sérieux de ChatGPT d’OpenAI et de Claude d’Anthropic.
Le Canvas récemment dévoilé offre aux utilisateurs un espace dédié pour créer et affiner des documents et du code avec l'assistance de l'IA en temps réel. Cette fonctionnalité permet aux utilisateurs de travailler de manière interactive avec Gemini AI, similaire aux environnements de codage en direct existants tels que GitHub Copilot ou OpenAI's Codex.
Canvas de Google s'intègre directement à Gemini, permettant aux utilisateurs de saisir des invites de codage et de voir des aperçus en direct de leur travail. Cette collaboration en temps réel garantit que les programmeurs peuvent dépanner, optimiser et affiner efficacement leur code. Cette fonctionnalité devrait être particulièrement utile pour les développeurs de logiciels cherchant à accélérer les flux de travail en tirant parti de l'IA pour les suggestions, le débogage et les améliorations structurelles.
L’introduction de Canvas témoigne de la stratégie plus large de Google visant à intégrer l’IA dans des applications du monde réel, reflétant la propre poussée d’OpenAI avec les plugins ChatGPT et l’expansion de Copilot par Microsoft dans ses outils de développement. Contrairement à l’aide au codage textuel actuelle de ChatGPT, l’approche de Google fournit un espace visuel et interactif, rendant le codage piloté par l’IA plus accessible.
Un autre ajout important à Gemini AI est Audio Overview, une fonctionnalité qui transforme le contenu écrit en discussions dynamiques de style podcast générées par l'IA. Cet outil est conçu pour les utilisateurs qui préfèrent l'apprentissage auditif ou souhaitent consommer des informations en déplacement. De la même manière que ChatGPT d'OpenAI peut générer des résumés textuels, l'aperçu audio de Google va encore plus loin en créant des explications engageantes de style conversation avec des voix générées par l'IA.
La fonctionnalité est actuellement disponible en anglais, avec des plans pour d'autres langues à l'avenir. Cela pourrait aider Google à s’implanter en tant qu’acteur clé dans l’espace audio de l’IA, en concurrence avec des services tels que les recommandations de podcast générées par l’IA de Spotify et les résumés audio basés sur l’apprentissage automatique d’Apple dans les podcasts Apple.
Ces deux fonctionnalités renforcent l’engagement de Google à intégrer l’IA dans les tâches quotidiennes, en fournissant aux utilisateurs des outils qui améliorent à la fois la productivité et l’accessibilité. En offrant un espace de travail d'IA pour le codage et une alternative audio au contenu contenant beaucoup de texte, Gemini AI évolue au-delà d'un simple chatbot pour devenir un assistant d'IA à part entière doté d'applications pratiques du monde réel.
Ces mises à jour sontmaintenant disponibleaux abonnés Gemini et Gemini Advanced, avec une disponibilité plus large attendue dans les mois à venir. Alors que Google continue d’affiner ses modèles d’IA, ces ajouts mettent en valeur les efforts continus de l’entreprise pour devenir leader dans le domaine de la productivité basée sur l’IA.
Lecture suggérée :Google Docs introduit des aperçus audio pour aider les utilisateurs à corriger les erreurs d'écriture
Source:Le bord
