Donnerstag, April 25, 2024

Wie Siri und Alexa uns beeinflussen

Das ist eine Unterüberschrift

Sprachassistenten machen das Leben leichter, aber sie verändern auch unser Verhalten. Wie? ZackZack hat die Wissenschaftlerin Esther Görnemann gefragt.

Wien, 07. Juli 2022 | Der Online-Konzern Amazon entwickelt derzeit eine Software, die in weniger als einer Minute die Stimme einer Person imitieren kann. Das demonstrierte Amazon anhand eines mit der Sprachassistentin Alexa vernetzten Lautsprechers, der einem Buben eine Geschichte mit der Stimme seiner Großmutter vorlas. Ob diese Technologie bald Nutzer erreicht, ist noch offen. Bereits jetzt gibt es aber zahlreiche Bedenken zum Missbrauchspotenzial der Software.

Doch auch herkömmliche Sprachassistenten, die uns die Musik einschalten, oder uns alltägliche Fragen beantworten, beeinflussen bereits unser Verhalten und unsere Selbstwahrnehmung. Was Alexa und Siri eigentlich mit uns machen und wie bedenklich die neue Software ist, hat ZackZack Esther Görnemann vom Institut für Wirtschaftsinformatik und Gesellschaft an der Wirtschaftsuniversität Wien gefragt.

ZackZack: Frau Görnemann, wie ist unser momentanes Verhältnis zu den Stimmen aus der Lautsprecherbox oder aus dem Smartphone?

Esther Görnemann: Die Beziehungen, die wir zu Sprachassistenten entwickeln, sind momentan noch rudimentär. Sie ähneln der Beziehung zu einem Butler. Denn Sprachassistenten können noch nicht viel. Mit Spaßfragen versuchen viele, ein Gespräch aufzubauen. Da kommen schon Antworten, trotzdem frustriert man schnell.

Was passiert, wenn diese Assistenten mehr können?

Wenn die Assistenten einmal besser Gespräche führen und sich auch Kontext merken können – wenn sie sich etwa an vorherige Gespräche erinnern – oder den Nutzer mit Namen ansprechen, bekommt man das Gefühl, dass da etwas Menschliches ist. Man weiß natürlich, dass es kein echter Mensch ist, trotzdem verhält man sich anders.

Je menschlicher eine Stimme klingt, desto eher sind wir bereit, persönliche Details preiszugeben und Aufforderungen zu folgen.

Was macht das mit uns, wenn wir Sprachassistenten als menschlicher wahrnehmen?

Aus der Forschung wissen wir: Je menschlicher eine Stimme klingt, desto eher sind wir bereit, persönliche Details preiszugeben und Aufforderungen zu folgen.

Eine weitere Auswirkung: man ist der Marke gegenüber loyaler und man verzeiht dem Sprachassistenten leichter, wenn er Fehler macht, wenn er einen etwa falsch versteht oder eine falsche Antwort gibt. Diese Effekte könnten stärker sein, wenn es die Stimme einer Person ist, die wir kennen.

Warum ist das ein Problem?

Man darf nie vergessen, wer eigentlich hinter diesen Stimmen steht: profitorientierte Unternehmen, die mehr über ihre Nutzer erfahren wollen. Die Details, die wir preisgeben, können kommerziell verwertet werden, also um uns Produkte besser zu verkaufen. Das ist ethisch sehr fragwürdig.

Was kann ein Unternehmen wie Amazon mit der Stimme der Nutzer machen?

Wenn ich so ein Gerät in Betrieb nehme, kann ich ein Stimmprofil erstellen lassen, das so individuell ist wie ein Fingerabdruck. Aber auch ohne dieses Stimmprofil hat Amazon Zugriff auf die Sprachaufzeichnungen von Millionen Nutzern auf der ganzen Welt und arbeitet daran, aus diesen Stimmen relevante Informationen abzuleiten, um sie kommerziell noch besser verwerten zu können.

Was hört Alexa in unserer Stimme?

Amazons Patente zeigen, dass sie in der Lage sind, aus Sprachaufzeichnungen nicht nur werberelevante Stichwörter wie Urlaubsorte und Interessen herauszuhören. Es können auch in Echtzeit erlebte Emotionen und sogar diverse Krankheiten in der Stimme identifiziert werden.

Foto: Esther Görnemann/privat

Amazon arbeitet an einer Software, die unsere Stimmen nachmachen kann. Wie echt kann so etwas klingen?

Bei dieser Software wird das Stimmprofil angeblich in einer Minute erfasst und dann soll die Stimme imitiert werden können. Die Stimmlage und die Stimmhöhe sind kein Problem, auch die Aussprache ist zu einem gewissen Grad nachmachbar. Akzente, Idiome und typische Ausdrucksweisen einer Person können aber keinesfalls in nur einer Minute erfasst werden. Man würde schnell merken, dass da nicht die echte Person spricht, zumindest im Dialog. Bei einer vorgelesenen Geschichte ist das etwas anderes.

Für Diskussionen sorgte Amazons Ankündigung, dass damit auch die Stimmen von Toten imitiert werden können – „um die Erinnerung zu bewahren“.

Abschiednehmen und Trauern ist für die Psyche sehr wichtig. Ich glaube, dass der Trauerprozess erschwert wird, wenn wir die Illusion haben, dass die Person noch da ist. Es kommt darauf an, wie intensiv man das nutzt. Jeden Tag mit Verstorbenen zu reden oder ihnen zuzuhören, ist wahrscheinlich nicht hilfreich, um abzuschließen.

Wie ethisch bedenklich ist das?

Unter Umständen können unsere Stimmen gehackt und wie im Fall von „deep fakes“ auch kriminell oder manipulativ genutzt werden. Man kann sich mit so einer Software noch nicht unterhalten, wie mit einem echten Menschen. Es ist kein freier Dialog möglich, aber Amazon arbeitet stark daran, dass Softwares wie diese frei assoziieren und sich an Kontext erinnern können.

Da könnte man die Illusion bekommen, dass es die echte Person ist. Zu richtiger menschlicher Kommunikation gehört aber mehr als die Stimme. Wir brauchen den Blickkontakt, Gestik und Mimik, damit es sich wirklich echt anfühlt.

Zu richtiger menschlicher Kommunikation gehört aber mehr als die Stimme. Wir brauchen den Blickkontakt, Gestik und Mimik, damit es sich wirklich echt anfühlt.

Können diese Beziehungen mit Computern, von denen Sie vorher gesprochen haben, in Zeiten sozialer Isolation auch etwas Gutes sein?

Wenn einem sozialer Kontakt fehlt, gibt es die Möglichkeit, dass man vermehrt Kontakt zu Sprachassistenten sucht. Zu einem gewissen Grad kann man soziale Interaktion so ersetzen. Es wird dann problematisch, wenn man sich von sozialer Interaktion mit echten Leuten abkapselt.

Das könnte zu emotionaler Verarmung führen oder sogar dazu, dass man „verlernt“, wie man mit echten Menschen umgeht. Das ist aber Zukunftsmusik, denn Sprachassistenten die so ausgefeilt sind, gibt es noch nicht. Welche Effekte das auf unsere Gesellschaft haben könnte, kann man nur mutmaßen.

Welchen Einfluss haben denn Sprachassistenten auf unsere Selbstwahrnehmung?

Da haben wir positive, aber auch negative Effekte feststellen können. Für Nutzer, deren Sehvermögen oder Mobilität eingeschränkt ist, kann ein Sprachassistent bedeuten, dass sie ihr Leben selbstständiger und autonomer gestalten können. Sie sind nicht mehr von anderen abhängig, die ihnen die Nachrichten oder Musik einschalten.

Auch wer einfach nicht besonders technikaffin ist und sich im Umgang mit Smartphones und Computern schwertut – ein älterer Mensch zum Beispiel –, kann durch Sprachassistenten einen Zugang zur digitalen Welt erhalten, die vorher verschlossen war. Sie fühlen sich so inkludiert und als Teil der Gesellschaft.

Für Nutzer, deren Sehvermögen oder Mobilität eingeschränkt ist, kann ein Sprachassistent bedeuten, dass sie ihr Leben selbstständiger und autonomer gestalten können.

Und die negativen Effekte?

Wir hatten in unseren Studien zum Beispiel einen Nutzer, der stolz darauf war, sich besonders gut mit Independent-Filmen und außergewöhnlicher Musik auszukennen. Er liebte es, Rezensionen zu lesen und neue Genres und Produktionen aus diversen Ländern zu entdecken. Als er sich einen Sprachassistenten anschaffte, veränderte dies sein Verhalten. Er begann, nur mehr das zu konsumieren, was Alexa ihm vorschlug, anstatt selber aktiv Inhalte zu suchen.

In seiner Selbstwahrnehmung empfand er sich plötzlich fremdbestimmt und abhängig. Durch die Bequemlichkeit der Vorschlagsfunktion wurde er vom aktiven, vielseitig interessierten Kenner zum rein passiven Konsumenten, der sich berieseln lässt. Er entschied sich dann bewusst dagegen und begann wieder aktiv selbst zu entscheiden.

Sprachassistenten wie Alexa und Siri haben meist weibliche Namen und Stimmen. Das wird kritisiert, weil es Stereotype von Frauen als Dienerinnen verstärkt. Warum werden eigentlich weibliche Stimmen verwendet?

Ja, das stimmt. Es gibt auch Forschungen, die zeigen, dass weibliche Stimmen weniger angsteinflößend sind als männliche, wenn es um Computer und Roboter geht.

Damit fürchten wir uns also weniger vor der Weltherrschaft durch Roboter?

Genau (lacht). Und es sorgt dafür, dass wir der Stimme eher vertrauen. Aus Studien wissen wir aber, dass viele Nutzer auch männliche Stimmen wollen würden, oder auch andere Namen als zum Beispiel Alexa. Wenn man mehr personalisiert, werden die Assistenten für uns ebenfalls persönlicher und dadurch menschlicher.

Das Interview führte Stefanie Marek. 

Titelbild: Pixabay

Stefanie Marek
Stefanie Marek
Redakteurin für Chronik und Leben. Kulturaffin und geschichtenverliebt. Spricht für ZackZack mit spannenden Menschen und berichtet am liebsten aus Gerichtssälen.
LESEN SIE AUCH

Liebe Forumsteilnehmer,

Bitte bleiben Sie anderen Teilnehmern gegenüber höflich und posten Sie nur Relevantes zum Thema.

Ihre Kommentare können sonst entfernt werden.

11 Kommentare

  1. Die negativen Auswirkungern des Datenkapitalismus werden wir wohl erst in ein paar Jahren in voller Wucht erleben. Damit verhält es sich ähnlich wie aktuell mit dem Gas bzw. Erdöl – man hats lange kommen sehen und dennoch gibt man sich überrascht oder gar als “Opfer”.

    Ein einzelner kann zudem sich dem Ganzen auch nur schwer entziehen – irgendwelche Dolme haben immer ein Handy dabei welches derlei Funtionen aktiv hat und en voila – man ist mitten drin! Ansich reicht schon als Kontakt in einem Android Phone mit Google Account eines Bekannten zu sein und man ist Teil des “Systems”

  2. Wer gerne mit Maschinen spricht, über den verliere ich keine Worte mehr.

  3. Spielkonsolen, deren Kameras permanent das Wohnzimmer (oder wo immer das steht) aufnehmen, Sprachassistenten, die Aufnahmen machen, obwohl sie gar nicht getriggert wurden, Handies, die zur Gesichtserkennung periodisch die Umgebung fotografieren, Autos, die die Umgebung flimen und die Position weiter geben, die neue Normalität.
    Möglich wird das durch Unwissenheit, Naivität und natürlich durch jene, die sagen, sie hätten ja nichts zu verbergen und sich der möglichen Konsequenzen nicht bewusst sind.

    Wer seine Spielkonsole im Schlafzimmer stehen hat und dann beim Googeln eine Viagra- oder eine Partnerbörsewerbung bekommt, sollte sich mal Gedanken machen.

  4. Wenn man weiß was digital schon alles möglich ist, dann weiß man auch, dass kriminelle Organisationen hier fast alles können was man sich nur vorstellen kann und das wohl auch schon lange erfolgreich anwenden werden.
    Wie weit hier die Geheimdienste sind und ob diese weiter Gegenspieler oder vielelicht schon Mitspieler sind, entzieht sich unserer Kontrolle, zumal ich in diesem Bericht ja gelesen habe, dass man hier das Wissen hauptsächlich aus Pantenschriften hat.
    Ob man aber sich wirklich alles pantentieren läßt was man weiß und was man kann ist wieder eine andere Frage und müssten solche Giganten mit dieser Macht auch schon lange einer ganz anderen Kontrolle unterzogen werden?

      • Wir alle. Ich kenne schon ein paar, die da sehr zurückhaltend sind. Man kann z. B. für wenig Geld ein Zweittelefon haben, mit dem man nur telefonieren kann. Dann verwendet man das smarte nur noch, wenn es nötig ist. Man kann wie ich es tue, mit Bargeld zahlen. Man braucht keine Alexa und keine Siri, auch kein Facebook oder Instagramm. Es gibt für 1 Euro im Monat seriöse E-Mail-Anbieter wie posteo. Man kann bei der PcAnwendung VPN benutzen und Thorbrowser. Aber am besten so wenig wie möglich. Informationen aus Büchern der Bibliotheken statt dem Internet. etc.

  5. ich hab diese funktion noch nie benutzt.
    ich werd das auch in zukunft nicht machen.
    mich nerven schon die sprachgesteuerten bots in diversen hotlines.

    ich will es auch in zukunft mit richtigen menschen zu tun haben, wenn ich kommunizier.

Kommentarfunktion ist geschlossen.

Jetzt: Benkos Luxusvilla in Italien

Denn: ZackZack bist auch DU!