Herzlich Willkommen auf Weltverschwoerung.de

Angemeldete User sehen übrigens keine Werbung. Wir freuen uns wenn Du bei uns mitdiskutierst:

Neues von der Spracherkennung

hives

Ritter Rosenkreuzer
20. März 2003
2.785
"Mein Computer weiß, wie ich mich fühle"
Wolf-Dieter Roth 06.01.2005

[...]

Zeynep Inanoglu und Ron Caneel vom Massachusetts Institute of Technology (MIT) haben eine neue Software entwickelt, die aufgrund von Musteraufnahmen entscheiden kann, ob ein Anruf eher einen fröhlichen oder einen traurigen Anlass hat und ob sie beruflich oder privat, wichtig oder unwichtig ist. "Emotive Alert" vergleicht dazu die Lautstärke, Tonhöhe und Sprechgeschwindigkeit der ersten zehn Sekunden des von den Anrufern hinterlassenen Textes und vergleicht diese mit acht Standardwerten, die aus Hunderten echter Aufnahmen konzentriert wurden und die Kriterienpaare "glücklich/traurig", "aufgeregt/ruhig", "offiziell/ungezwungen" und "dringend/nicht dringend" repräsentieren. Danach erhält der Angerufene eine SMS mit dem entsprechenden Emoticon, berichtet das Wissenschaftsmagazin New Scientist in seiner am 8. Januar erscheinenden Ausgabe.

Bei ersten Testläufen konnte die Software gut anhand der Sprachmuster aufgeregte und ruhige sowie glückliche und traurige Nachrichten unterscheiden. Schwierigkeiten gab es dagegen bei der Unterscheidung offizieller und inoffizieller sowie dringender und nicht so dringender Anrufe: Hier spielt der Inhalt der Botschaft eine größere Rolle als die reine Sprachmelodie. Deshalb soll noch ein Spracherkennungsprogramm zugeschaltet werden, was dann spezifische "Alarmworte" erkennt. Allerdings verliert der "gefühlsechte Anrufbeantworter" damit seine jetzige Unabhängigkeit von der Sprache des Anrufs.
http://www.heise.de/tp/r4/artikel/19/19171/1.html


:lol:

da kann ich mir schon lebhaft die anwendung vorstellen:

"Entschuldigt bitte vielmals meine verspätete Reaktion. Falls es das nächste Mal um Leben und Tod geht, versucht bitte, schnell und laut zu sprechen, angespannt zu klingen sowie einige Begriffe wie "dringend" und "lebensnotwendig" einzubauen...."
 

general

Auserwählter Meister der Neun
30. März 2004
982
"Entschuldigt bitte vielmals meine verspätete Reaktion. Falls es das nächste Mal um Leben und Tod geht, versucht bitte, schnell und laut zu sprechen, angespannt zu klingen sowie einige Begriffe wie "dringend" und "lebensnotwendig" einzubauen...."

:lol: der ist gut!

Aber die Entwicklung ist insofern tragisch, dass wir uns damit nicht mehr auf unsere eigenen Gefühle und das Gehör verlassen werden. So, der war also traurig, sagt mein Anrufbeantworter. Na denn...tröste ihn, Computer.
 

hives

Ritter Rosenkreuzer
20. März 2003
2.785
general schrieb:
Aber die Entwicklung ist insofern tragisch, dass wir uns damit nicht mehr auf unsere eigenen Gefühle und das Gehör verlassen werden. So, der war also traurig, sagt mein Anrufbeantworter. Na denn...tröste ihn, Computer.
aber nur, wenn die wimmerfrequenz auch gestimmt hat ;)
 

Trestone

Geheimer Meister
12. April 2002
306
Computer und Spracherkennung erscheint mir wie ein Rennen zwischen Dreirad und Formel-1-Boliden.
Schließlich sind formale Sprachen nur ein schwacher Abklatsch unseres natürlichen Sprechens - das zwar kinderleicht aber wohl doch auch schwer zu formalisieren ist.
Immerhin könnte auch meine paradoxe Logik ein Baustein zu eloquenteren Computern sein, auch wenn ich diese Anwendungsrichtung noch nicht verfolgt habe:
http://www.weltverschwoerung.de/modules.php?name=Forums&file=viewtopic&t=16058

Gruß
Trestone
 

Elbee

Vorsteher und Richter
28. September 2002
730
Die Spracherkennungssoftware ist quasi die Rückseite der Sprachsynthesesoftware. Die Programmiererbemühung, den Maschinen das Zuhören beibringen empfinde ich als genauso kurios, wie ihnen das Sprechen aufzuhalsen. Den echten Menschen wird ja kaum richtig zugehört, und da glaubt ein Entwickler, den Quasselrobots schenkt jemand Beachtung. Na gut, vielleicht bei puren Organisationsabwicklungen wie Paketdienste etc. Doch ich habe auch noch beruflich damit zu tun und habe so relativ aktuelle Resultate vorliegen, natürlich nichts aus dem Militärbereich, die über das reine Abfrühstücken von Optionsfragen kaum rausgehen. Und wenn die Umgebungsgeräusche zu hohe Pegel haben, dann versteht der Siliconkamerad komplett Bahnhof.

Ein guter Synchronsprecher oder Schauspieler macht dem Sprachroboter noch lange was vor, und wenn meine Frau ein bisschen weinerlich klingt, dann schickt der ihr wohl noch Blumen per Internet. Hat also sein Gutes.

Dennoch: Das entwickelt sich weiter und es wird langsam Zeit für die Robotergesetze von Asimov. Wie man in "Little Lost Robot" nachlesen kann kriegen die nämlich auch Gewissensbisse, wenn sie was falsch verstanden haben ...
 

Trestone

Geheimer Meister
12. April 2002
306
Ich habe mal wo gelesen, das die Spracherkennung mit der Teil - Ganzes - Beziehung kämpft:

Ein "e" und ein "a" können physikalisch ganz identisch sein, wenn man nur Frequenzen etc. misst, aber wir hören je nach Kontext (Situation) ein Wort mit deutlichem "a" oder "e"-Klang, d.h es findet eine Einfärbung und Deutung durch den Hörer statt.

Dazu wird interessanterweise auch die nahe Zukunft benutzt, denn bewußt wird uns das gehörte erst ca. 1 Sekunde nach Ankunft im Gehirn, wenn dort schon erste Informationen zu den nächsten Silben vorhanden sind.
Wir hören die Worte also zum Teil von hinten her ...
Aber das kann ein Computer auch.

Was er nicht so leicht kann, ist den Kontext herstellen und alle Sinneskanäle zu nutzen. Denn Situationen (z.B. im Bahnhofslärm) sind ziemlich komplex, und wir haben auch unbewußte Wahrnehmungen.

Zunächst können wir mit dem Computer aber höchstens die Wahrnehmungen simulieren, die wir analysiert und in Modelle gegossen haben. wie soll das für noch unendeckte Anteile gehen (Eisberg :?: ).

Falls diese gering oder für Spracherkennung nicht so relevant sein sollten,
bliebe noch die Frage, ob man ohne Verstehen verstehen kann.
Wenn allerdings nicht, wie verstehen dann unsere Kinder?
Oder meinen wir nur zu verstehen? ... :?:
 

Trasher

Ritter der ehernen Schlange
10. April 2002
4.104
Trestone schrieb:
Ein "e" und ein "a" können physikalisch ganz identisch sein, wenn man nur Frequenzen etc. misst, aber wir hören je nach Kontext (Situation) ein Wort mit deutlichem "a" oder "e"-Klang, d.h es findet eine Einfärbung und Deutung durch den Hörer statt.
Das geht ja schon bei den Dialekten los. Da werden Vokale von Region zu Region ganz unterschiedlich eingefärbt, sodass eine Spracherkennung immer einen Kontext oder eine Kalibrierung braucht, um den richtigen Buchstaben zu ermitteln. Allerdings geht es dem Menschen ganz genauso.
 

Trestone

Geheimer Meister
12. April 2002
306
In einem Zeitungsartikel (Süddeutsche?) habe ich vor ein paar Tagen gelesen, das wir buchstäblich auch mit den Augen hören:
Je nach Farbe, empfanden Probanden einen gerüaschvollen Gegenstand (z.B ICE) als unterschiedlich laut/störend, obwohl die Schallwellen jeweils gleich waren ...
 

rorriM

Geheimer Meister
2. Juni 2003
175
Trestone schrieb:
In einem Zeitungsartikel (Süddeutsche?) habe ich vor ein paar Tagen gelesen, das wir buchstäblich auch mit den Augen hören:
Je nach Farbe, empfanden Probanden einen gerüaschvollen Gegenstand (z.B ICE) als unterschiedlich laut/störend, obwohl die Schallwellen jeweils gleich waren ...

vor jahren, daran dachte ich noch irgendwann diese woche, habe ich im tv etwas ähnliches gesehen. leute, den grund habe ich vergessen, bei denen irgendwelche synapsen oder derartiges falsch funktionieren, vor deren auge sich ein richtiges feuerwerk abspielt, wenn sie lautes wahrnehmen.
wenn ich micht nich täusche, funktioniert das alles auch andersrum, dass auch visuelle reize andere sinne stimulieren können.

das alles hatte nichts mit suggestiver wahrnehmung zu tun sondern es gibt diese störung wohl wirklich, und ich meine mich darüber gewundert zu haben, wieviele davon sogar betroffen sind.

ewigkeiten her alles.. irgendwer hat hier sicherlich mehr ahnung oder sogar ein paar interessante links zu.
 

Ähnliche Beiträge

Oben Unten