Sprachassistenten- FAQ

 

Wie funktionieren die Sprachassistenten?

 

Wenn ein Sprachassistent einen Audioeingang empfängt, muss er mehrere Schritte durchlaufen, bevor er angemessen reagieren kann. Nehmen wir an, wir haben einen Sprachassistenten gebeten, ein Teammeeting zu planen. Eine exemplarische Vorgehensweise dieser Aufgabe lässt sich wie folgt zusammenfassen:

 

1) Der Sprachassistent zeichnet die Sprache auf, entfernt Hintergrundgeräusche und teilt die Sprache in ihre Bestandteile auf.

2) Die Rede wird in dem, was der Assistent für den wahrscheinlichsten Satz hält, basierend auf den Mustern interpretiert.

3) Der Assistent bestimmt die wichtigsten Wörter und die wahrscheinlichste Absicht des Textes.

4) Wenn Sie weitere Informationen benötigen, z. B. Zeit oder Datum des Meetings, kann der Assistent Fragen stellen. Alternativ kann er entscheiden, dass er zuversichtlich genug ist, um ohne weitere Informationen fortzufahren.

5) Zum Schluss werden die Befehle in einer Decision Engine verarbeitet und die Besprechung geplant.

 

Viele dieser Aufgaben sind stark von der Verarbeitung natürlicher Sprache (NLP) abhängig. Hierbei handelt es sich um ein Gebiet der Informatik, das sich allgemein mit der Fähigkeit einer Maschine befasst, das Gesagte zu erkennen, ihre Bedeutung und die geeignete Aktion zu verstehen und in einer Sprache zu reagieren, die der Benutzer verstehen wird.

 

Innerhalb des NLP gibt es zwei Unterfelder, die insbesondere Sprachassistenten betreffen: Verständnis natürlicher Sprache (NLU) und Erzeugung natürlicher Sprache (NLG). Es ist nicht überraschend, dass sich NLU hauptsächlich auf die Fähigkeit von Maschinen konzentriert, Sprache oder Texteingabe zu erkennen, zu verstehen und diesen eine Bedeutung zuzuordnen, während NLG den umgekehrten Prozess behandelt: computergenerierte Antworten in Text oder Sprache umwandeln, die ein Mensch verstehen kann.

 

Alles in allem gibt es drei Hauptprobleme, die jeder Sprachassistent lösen muss. Um effektiv arbeiten zu können, müssen sie in der Lage sein, Spracheingaben in genauen Text umzuwandeln, diesem Text eine Struktur hinzuzufügen und seine Bedeutung richtig zu interpretieren. Durch einen genaueren Blick auf diese Probleme können die Werkzeuge identifiziert werden, die zum Aufbau eines funktionierenden Sprachassistenten erforderlich sind.

 

 

Was ist ein Skill (für Alexa)?

Amazons Alexa ist die Sprachassistentin mit der Menschen mit ihrem Amazon Echo, Echo Dot und anderen Amazon Smart Home-Geräten sprechen können. Wie Siri (von Apple) und Cortana (von Microsoft) reagiert Alexa auf eine Reihe verschiedener Befehle und unterhält sich sogar mit Benutzern. Alexa Skills sind Apps, die Alexa noch mehr Fähigkeiten verleihen, sodass sie mit mehr Geräten sprechen kann, auch mit Webseiten.

 

 

Was ist ein Action (für Google)?

Google Actions erweitern die Funktionalität des Google Assistant, des virtuellen persönlichen Assistenten von Google. Bei Alexa heißt es Skill und bei Google heißt es Actions. Die Funktionalitäten von Google Assistant können durch Google Actions erweitert werden und für Smart Speakers, Telefone, Autos, Fernseher, Kopfhörer, Armbanduhren und weiteren Geräten angewendet werden. Nutzer engagieren Google Assistant für Gespräche, um Dinge zu erledigen, z.B. Lebensmittel kaufen oder eine Fahrt buchen.

Als Google Actions Entwickler können wir mit Actions auf einfache Weise reizvolle und effektive Konversationserfahrungen zwischen Nutzern und Ihrem Actions erstellen und verwalten.

 

 

Was kostet es, ein Alexa Skill zu programmieren?

Die typische Frage ist genau wie "was kostet ein Auto" oder "was kostet ein Mobile App". Die Antwort darauf ist normalerweise „es kommt darauf an, was Sie wollen“. Wir möchten aber helfen, das Thema ganzheitlich zu verstehen und deswegen können wir als ganz grobe Orientierung sagen, dass die Kosten ab 5.000 Euro betragen. Billiger und teuer geht es immer. Frag uns gerne nach und äußere deine Wünsche und wir können dir ganz grob die Kosten mitteilen. Fragen kostet bei uns nichts :).

 

 

Was ist der Unterschied zwischen ein Skill, einer Aktion, einer Shortcuts oder einer Capsule?

Nun, sie sind alle dasselbe Konzept, aber die Terminologie, die auf verschiedenen Plattformen verwendet wird, ist unterschiedlich - beispielsweise verwenden Amazon (Alexa) und Microsoft (Cortana) "Skill", Google (Assistent) verwendet "Action", die Apple (Siri) verwendet „Shortcutsn“ und Samsung (Bixby) verwendet „Capsule“.

Hier eine Liste von Hersteller, Sprachassistenten und die "Terminologien für die Funktionen".

 

  • Hersteller: Google
  • Terminologie: Google Actions
  • Sprachassistent: Google Assistant

 

  • Hersteller: Amazon
  • Terminologie: Skill
  • Sprachassistent: Alexa

 

  • Hersteller: Samsung
  • Terminologie: Capsule
  • Sprachassistent: Bixby

 

  • Hersteller: Apple
  • Terminologie: Shortcuts
  • Sprachassistent: Siri

 

  • Hersteller: Microsoft
  • Terminologie: Skill
  • Sprachassistent: Cortana

 

Warum sollten Sie für blueShepherd GmbH entscheiden?

Wir haben Erfahrung mit User Experience Design, Programmierung und Voice User Interface (VUI), die man für die Sprachassistenten-Skills, Actions, Shortcuts und Capsule ebenfalls benötigt. Wir sind kein Tech-Only Unternehmen sondern eher ein Media-Tech Unternehmen. Wir verstehen die Media, Zielgruppen, Mediaprodukte, Mediastrategie und Interaktions-Zusammenhänge sehr gut, die man für Sprachsteuerung und Sprachassistenten-Strategien braucht. Profitieren Sie auch von den Media-Tech Erfahrungen von blueShepherd. Wir entwickeln nicht nur ein Skill…..wir entwickeln ein Spracherlebnis.

 

Was ist ein Skill (für Alexa)?

Einfach ausgedrückt: eine App für Smartphone/ Tablet ist ein Skill für die Smart Assistenten. Genau wie wir auch in der App-Welt die Vielfalt haben (z.B. Apps für Android oder Apps für Apple Store) gibt es auch Skills für Alexa und Actions für Google Smart Assistenten. Mit den Skills können Sie Ihr Amazon Echo-Gerät mit weiteren Features und Fähigkeiten ausstatten.

Die Funktionalitäten von Alexa können durch Skills erweitert werden und für Smart Speakers, Telefone, Autos, Fernseher, Kopfhörer, Armbanduhren und weiteren Geräten angewendet werden. Als Alexa Skill Entwickler können wir mit Skills auf einfache Weise reizvolle und effektive Konversationserfahrungen zwischen Nutzern und Ihrem Skill erstellen und verwalten.

 

 

Was ist ein Action (für Google)?

Actions erweitern die Funktionalität des Google Assistant, des virtuellen persönlichen Assistenten von Google. Bei Alexa heißt es Skill und bei Google heißt es Actions. Die Funktionalitäten von Google Assistant können durch Google Actions erweitert werden und für Smart Speakers, Telefone, Autos, Fernseher, Kopfhörer, Armbanduhren und weiteren Geräten angewendet werden.

Nutzer engagieren Google Assistant für Gespräche, um Dinge zu erledigen, z.B. Lebensmittel kaufen oder eine Fahrt buchen. Als Google Actions Entwickler können wir mit Actions auf einfache Weise reizvolle und effektive Konversationserfahrungen zwischen Nutzern und Ihrem Actions erstellen und verwalten.

 

Muss man dann für jeden Assistent separat ein Skill, Capsule, Shortcuts oder Action erstellen?

Ja, aktuell muss man pro Sprachassistent separat die Funktionalitäten erstellen/ programmieren. Das heißt, dass Stand heute (März 2019) keine Möglichkeit gibt einmal ein Feature oder Funktionalität oder Anwendung zu definieren, die automatisch für alle Sprachassistenten gilt.

 

Brauche ich überhaupt ein Alexa Skill oder Bixby Capsule?

Man muss kein Skill haben. Es ist aber jedenfalls empfehlenswert, dass man JETZT mit einem Skill, Actions, Capsule oder Shortcuts Präsenz zeigt und die Erfahrungswerte sammelt. Natürlich sollten die Opportunitätskosten nicht ignoriert werden, dass man bestimmte Zielgruppen nicht über Alexa Skill bedient und die Zielgruppe dann ein Wettbewerber-Skill nutzt.

Die grundsätzliche Entscheidung ist, ob man die Sprachassistent-Skill auch als „Touchpoint“ oder „Point of Information“ nutzen möchte? Die Assistenten lernen noch...aber genau jetzt ist die Zeit, dass die Assistenten lernen "Ihre Marke oder Ihr Produkt" zu berücksichtigen, wenn eine passende Frage von User gestellt wird. Die Informationen hier gelten auch für Google Actions, Siri Shortcuts und Bixby Capsule. Wir würden Dir jedenfalls empfehlen, für den deutschen Markt mit Alexa Skill präsent zu sein. Wenn das Budget erlaubt dann auch Google Action launchen.

 

Muss man ein Alexa Skill haben um in der Alexa-Welt präsent zu sein?

Es kommt drauf an, was wir wollen, was die Zielgruppe über die Marke/ das Produkt/ die Dienstleistung wissen sollen. Alexa besitzt Basisinformationen und Fähigkeiten, dem User diverse Informationen zu geben. Alexa kann z.B. Öffnungszeiten oder Wetter etc. Informationen, soweit vorhanden, kommunizieren. Oft kann Alexa aber nicht oder nicht immer über die eigene Marke, Produkt, Dienstleistung und Umfang Information geben. Die Informationen hier gelten auch für Google Actions, Siri Shortcuts und Bixby Capsule. Das ist ja genau der Grund, warum man Skill oder Action braucht. Das sind die erweiterten Funktionalitäten.

 

Was kostet es, ein Alexa Skill zu programmieren?

Die typische Frage ist genau wie “was kostet ein Auto” oder “was kostet ein Mobile App”. Die Antwort darauf ist normalerweise „es kommt darauf an, was Sie wollen“. Wir möchten aber helfen, das Thema ganzheitlich zu verstehen und deswegen können wir als ganz grobe Orientierung sagen, dass die Kosten ab 5.000 Euro betragen. Billiger und teuer geht es immer. Frag uns gerne nach und äußere deine Wünsche und wir können dir ganz grob die Kosten mitteilen. Fragen kostet bei uns nichts :).

Wir haben auch diverse Sprach/Voice-Produkte wie Speech-To-Text, Sprachsuche-Optimierung, Speech Recognition etc. Hierzu kommen diverse neue Produkte bis Ende des Jahres. Fragen Sie uns gerne nach. Wir können auch die bestehenden Alexa Skills für die User Experience, Usability, Funktionalitäten optimieren. 

 

Welche Tools verwendet blueShepherd, um Alexa-Fähigkeiten aufzubauen bzw. ein Alexa Skill zu entwickeln?

Wie bei jeder Softwareanwendung gibt es viele verschiedene Möglichkeiten, eine Alexa-Fähigkeit zu entwickeln. Der beste Weg hängt von Ihrem vorhandenen Technologie-Stack ab und davon, wie ein Alexa Skill in verschiedene Datenquellen eingebunden werden kann. Die einfachste und schnellste Möglichkeit ein Alexa Skill zu erstellen besteht darin, es bei Amazon AWS zu hosten, AWS Lamba (eine Serverless Computing-Plattform) zu verwenden und dann die Lambda-Funktion in C #, Java, Javascript (Node.JS) oder Python zu erstellen.

 

Kann man Alexa Skill Inhalte updaten und/ oder ändern?

Ja, kann man Skills updaten und ändern. Je nach Änderungen und Updates muss ein Skill durch Amazon erneut zertifiziert werden (genau wie der Appstore Approval Prozess). Erfahrungsgemäß dauert es aber aktuell nur wenige Tage und nicht Wochen oder Monate.

 

Können auch Skills für anderen Ländern entwickelt werden?

Natürlich können wir auch Alexa Skills für andere Länder entwickeln. Wir haben bereits Skills für diverse Ländern und in diversen Sprachen entwickelt. Wir haben Skills für Deutschland, USA, U.K., Indien, Australien und Kanada entwickelt. Wir haben Skills auf Deutsch, Englisch und Französisch entwickelt. Wir haben auch diverse Skill-Ideen, die noch nicht veröffentlicht worden sind aber die Test-Versionen schon vorhanden sind. Fragen Sie uns gerne nach Referenzen.

 

Wie geht man mit Datenschutz für Skills um?

Amazon hat eine eigene Datenschutzerklärung für Alexa. Auch Sie werden eine eigene Datenschutzerklärung für Ihre Alexa Skills benötigen. Gerne helfen wir mit unserem Datenschutz-Partnerfirmen weiter.

 

Ich habe keine Idee für ein Alexa Skill aber gerne möchte ich ein Skill für meine Marke erstellen. Könntet ihr mir hier mit Ideen und Use cases helfen? 

Unsere Stärke ist, dass wir keine Tech-Only Firma sind sondern eine Media-Tech Firma sind. Wir haben die Mediadenke, können in Zielgruppen, Touchpoints, Nutzerverhalten etc. Welten denken und Dir für Alexa Skills mit Ideen und Konzepten helfen.

 

Ich habe eine konkrete Idee wofür ich gerne eine Kosteneinschätzung und Entwicklungszeitraum-Informationen benötige. Könntet ihr mir eine grobe Einschätzung geben?

Natürlich könnten wir anhand einer Idee und Scope die Aufwandseinschätzung (Kosten und Zeit) und ggf. Ressourcen-Einschätzung geben. Meistens könnten wir dann schon eine Preisrange und Zeitrange mitteilen. Fragen Sie uns gerne an. Sie werden unsere Expertise und Media-Erfahrung sofort erkennen.

 

Wie und wo ordnet ihr das Thema Sprachassistenten in die Mediagattungswelt ein?

Aktuell sehen wir das Thema sehr stark aus der SEO-, Sprachsuche Optimierung-, Smartassistenten- und Smart Speaker-Perspektive. Je fortgeschrittener die Entwicklung von Sprachassistenten ist, desto mehr integrierte Nutzung und Vernetzung von Geräten, Touchpoints und mediale Kommunikation werden wir sehen. Mit IoT (Internet of Things), SmartFridge oder SmartCars und weiteren Hard- und Software-Kombinationen wird die Zuordnung eine Andere sein.

 

Sind Analysen verfügbar, um die Nutzung von Alexa Skill zu messen?

Amazon bietet das “Skills Metrics Dashboard” als Teil des Alexa Skills Kit an. Über dieses Dashboard können wir Daten zu Ihrem Skill über Kunden, Sitzungen, Äußerungen und Absichten sehen. Es gibt auch einige neue Analysetools von Drittanbietern (einschließlich Smartly.ai und Voice Insights), die unterschiedliche Einblicke bieten. Die Tools sind kostenpflichtig und ggf. an weiteren Bedingungen verknüpft.

 

Kann ich ein Skill auch löschen bzw. deaktivieren?

Natürlich kann ein Alexa Skill auch deaktiviert und gelöscht werden.

 

Was ist Alexa?

Alexa ist der digitale Sprachassistent von Amazon. Alexa kann auf Smartphones und der Echo-Produktlinie von Amazon verwendet werden. Mittlerweile gibt es auch diverse „Third-Party“ Geräte und Produkte in denen die Alexa Sprachassistentin integriert ist.

 

Warum heißt Alexa Alexa?

Das Wort “Alexa” wurde gewählt, weil das “X” für die Spracherkennung leichter zu erkennen ist und das Wort auch eine Hommage an die berühmte alte Bibliothek von Alexandria ist.

 

Wie arbeitet Alexa?

Die technischen Details von Alexa sind komplex…aber blueShepherd macht es einfach und verständlich für Sie.

Nach der Aktivierung (siehe Setup weiter unten) wird durch das einfache Ansagen von “Alexa” der Dienst gestartet. Dann beginnt (oder versucht) Alexa zu interpretieren, was Sie sagen. Zum Abschluss Ihrer Frage / Ihres Befehls sendet Alexa diese Aufzeichnung über das Internet an die Cloud-Server von Alexa, auf denen AVS (Alexa Voice Service) installiert ist. Der Alexa Voice-Dienst konvertiert dann Ihre Sprachsignale in Computersprachenbefehle, mit denen Sie eine Aufgabe ausführen können (z. B. nach einem angeforderten Dienstleistung oder Produkt suchen) oder die Computersprache wieder in Tonsignale umwandeln, so dass Sie die Informationen wieder im Sprachform zurückbekommen.

Wenn Ihre Internetverbindung ordnungsgemäß funktioniert und der Back-End-Service von Amazon ebenfalls ordnungsgemäß funktioniert können die Antworten so schnell wie möglich gegeben werden. Bei Produkten wie dem Amazon Echo oder Echo Dot werden die Antworten nur in Audio-Form ausgegeben. Bei Echo Show und in begrenztem Umfang auf einem Smartphone werden die Informationen jedoch zusätzlich zum Audio auch über Bildschirmanzeigen bereitgestellt. Mit einem Alexa-fähigen Amazon-Gerät kann Alexa auch Befehle an andere kompatible Geräte von Drittanbietern übergeben.

 

Braucht man unbedingt Internet um Alexa bedienen zu können?

Da der Cloud-basierte Alexa Voice Service benötigt wird, um Fragen zu beantworten und Aufgaben auszuführen, ist eine Verbindung zum Internet erforderlich – kein Internet, keine Alexa-Interaktion. Hier kommt die Alexa App ins Spiel.