Online-Weiterbildung
Präsenz-Weiterbildung
Produkte
Themen
Dashöfer

Talking with AI: Sprechen Sie jetzt mit ChatGPT

08.08.2024  — Michelle Bittroff.  Quelle: Verlag Dashöfer GmbH.

Spracherkennung und Sprachsynthese sind wesentliche Bestandteile der KI-gesteuerten Kommunikation und bieten viele Vorteile, von erhöhter Barrierefreiheit bis hin zu effizienterer Kommunikation. Allerdings gibt es ein Tool von ChatGPT, das die wenigsten bisher für sich entdeckt haben. Was es damit auf sich hat, erfahren Sie hier.

So funktioniert die Sprachsteuerung

Wir unterscheiden in der KI-gesteuerten Kommunikation in zwei wesentliche Bereiche:

Spracherkennung (Speech-to-Text): Bezeichnet die Technologie, die gesprochene Sprache in schriftlichen Text umwandelt. Beispiele sind hier Diktier-Apps oder Sprachassistenten, die gesprochene Befehle in Textform erfassen und verarbeiten. Diese können an unterschiedlichen Stellen unterstützen, zum Beispiel beim:

  • E-Mails und Nachrichten diktieren: Dies ist besonders nützlich, wenn Sie unterwegs sind oder keine Zeit haben, längere Texte manuell einzugeben.
  • Berichte, Dokumentationen und Protokolle erstellen: Personen in Unternehmen können Protokolle von Sitzungen mit KI anfertigen lassen. Fachleute wie Anwälte und Ingenieure können Berichte und Dokumentationen diktieren. Dies erleichtert die Erstellung umfangreicher Berichte und verbessert die Effizienz der Dokumentationsprozesse. Anstatt Stunden am Computer zu verbringen, können Sie Ihre Gedanken einfach sprechen und die KI erledigt den Rest.

Sprachsynthese (Text-to-Speech): Bezeichnet die Technologie, die geschriebenen Text in gesprochene Sprache umwandelt, so unter anderem in E-Readern oder Sprachassistenten mit Vorlesefunktion. Das ist allerdings auch möglich bei:

  • Präsentationen und Vorträgen: Hier können Redende Text-to-Speech nutzen, um Teile ihres Vortrags automatisch vorlesen zu lassen. Dies kann hilfreich sein, um konsistente und klare Kommunikation sicherzustellen, insbesondere bei komplexen oder technischen Themen.
  • Trainings- und E-Learning-Plattformen: Oder Sie lassen sich einfach Lernmaterialien vorlesen. Dies ist besonders nützlich für Lernende, die besser durch Zuhören verstehen, und es ermöglicht eine flexible Nutzung von Lerninhalten. Mitarbeitende können so Weiterbildungskurse auch unterwegs absolvieren und wertvolle Zeit im Büro sparen.

Auch OpenAI hat die Sprachfunktion längst für sich entdeckt! Doch haben Sie gewusst, dass Sie Ihre Prompts in ChatGPT auch einfach aufsagen können, anstatt sie zu tippen? Und dabei sogar eine gesprochene Antwort von ChatGPT erhalten?

Mit der KI sprechen: So geht‘s

Bereits im September 2023 kündigte OpenAI die Sprachsteuerung in ChatGPT an. Diese war zunächst nur für Nutzende der kostenpflichtigen Pro-Version zugänglich, doch seit November vergangenen Jahres kann das neue Tool von jedermann genutzt werden.

Das Grundprinzip der Sprachsteuerung orientiert sich an ähnlichen Modellen wie Alexa oder Siri. Man gibt der Künstlichen Intelligenz einen Befehl, den diese dann ausführt. Die Sprachsteuerung kann in den ChatGPT-Apps für Android und iOS genutzt werden, muss aber zunächst in den Einstellungen aktiviert werden.

Um die Funktion zu aktivieren, folgen Sie diesen Schritten:

  1. Öffnen Sie die Einstellungen.
  2. Wählen Sie die Sprachoption unter „neue Funktionen“.
  3. Aktivieren Sie die Sprachoption.
  4. In den Chatverläufen erscheint nun ein Kopfhörer-Symbol. Klicken Sie auf das Kopfhörer-Symbol.
  5. Ein großer weißer Kreis auf schwarzem Hintergrund signalisiert, dass die KI bereit ist, zuzuhören: Sprechen Sie Ihre Frage ein. Daraufhin bewegen sich vier kleine Kreise in einer wellenartigen Form, um anzuzeigen, dass die Aufnahme läuft.
  6. Während die KI Ihre Frage verarbeitet und die Antwort vorbereitet, erscheint eine comicartige Gedankenblase. Danach erhalten Sie Ihre Antwort.

Sie wollen eine Stimmprobe von den fünf Varianten hören in denen ChatGPT Ihnen antwortet? Dann klicken sie hier.

Wenn Sie die oben genannten Schritte berücksichtigen, dann steht Ihnen in Ihrem täglichen Gebrauch mit ChatGPT Voice nichts mehr im Weg!

nach oben
FAQ