Spracherkennung mit dem Logitech ClearChat Wireless

Heute teste ich mein neues Headset, das Logitech ClearChat Wireless, mit der Software “Dragon NaturallySpeaking” auf meinem ASUS EeePC 1000H.

Nachdem ich die Systemvoraussetzungen geprüft und für ausreichend befunden habe, installiere ich zunächst die Software für die Sprachsteuerung auf dem Netbook. Nach der Installation übertrage ich das zuvor erstellte Sprachprofil von meinem Desktop PC per Netzwerk auf das Netbook. Nach dem erfolgreichen Import der Datei, muss sich lediglich das Audiosetup erneut durchführen.

Das Logitech Headset wird mit einem USB Empfänger in Form eines USB-Sticks geliefert. Die Installation erfolgt durch Plug and Play. Treiber von einer CD oder aus dem Internet sind nicht erforderlich. Ich testete dies unter Windows XP und Vista.

 

Nun zu den Ergebnissen des Tests: ein Diktat in ruhiger Umgebung führte auf Anhieb zu sehr guten Ergebnissen. Ein anschließender Härtetest in der Küche, bei laufender Spülmaschine, eingeschaltetem Wasserkocher und spülender Ehefrau zeigte nur kleinere Aussetzer. Dazu muss man noch erwähnen, dass ich für dieses Sprachprofil nur das kurze Anlernen verwandt habe. Ein längeres Training mit dieser Software wird wohl zu noch besseren Ergebnissen führen. Einen weiteren Test werde ich in den nächsten Tagen im Auto durchführen. Dies wird dann zwar ein paar verwirrte Blicke anderer Verkehrsteilnehmer zur Folge haben, doch wäre es schön, bei längeren Autofahrten nebenbei einen Blogbeitrag zu verfassen.

Übrigens: dieser Text ist rein mit Sprachsteuerung entstanden. Ich musste nur dreimal mit der Tastatur eingreifen, um Wörter zu korrigieren. Nach einem manuellen Anlernen, zum Beispiel des Wortes “Netbook”, funktionierte die Erkennung jedoch reibungslos. 

Noch ein Wort zu den Headset: es ist sehr angenehm zu tragen, die Tonqualität ist für meinen Geschmack sehr gut, die Kopfhörer kämpfen die Umgebungsgeräusche erstaunlich gut ab und das Mikrofon liefert tolle Ergebnisse. Die Funktionen lauter, leiser und stumm lassen sich direkt am Headset steuern. Zusätzlich lässt sich das Mikrofon auch durch einfaches Einklappen deaktivieren. Die Reichweite liegt, wie angegeben, bei etwa 9-10 m. Ich testete das Headset jedoch noch nicht mit der beiliegenden USB Dockingstation, in die der USB Empfänger gesteckt werden kann. Dieses Zubehörteil ist sicher für den Einsatz am Desktop PC gedacht und mit dem langen Kabel für den mobilen Einsatz eher störend als hilfreich. Der Preis des Headsets wird von Logitech mit 99 € angegeben. Ich habe jedoch im Computerladen meines Vertrauens das Headset für 69 € erstanden. Der netto Einkaufspreis beim Computergroßhandel liegt bei etwa 58 € netto.

Das sollte nun ersteinmal genügen. Ach ja, noch etwas: die Spracherkennung macht so gut wie keine Rechtschreibfehler. Lediglich die Groß- und Kleinschreibung macht hin und wieder ein paar Probleme. Gut für jeden, der in der Schule nicht aufgepasst hat. Wer hier nun doch einen Fehler findet, darf ihn behalten.

Grüße, Dennis

Aus dem Leben eines Handelsvertreters – Folge 2

16Uhr: Herr M hat Feierabend (falls jetzt niemand mehr anruft). Um 8Uhr fing der Tag des Handelsvertreters im Büro an. Mails kontrollieren und bearbeiten, 2-3 Kunden anrufen, Angebote nachfassen und heutige Vorgänge vorbereiten.

Plötzlich Handy, SMS. Terminabsage des Nachmittagstermins wegen irgendwas unwichtigem – klar mit ihm kann man es ja machen. Aber ist ja auch nicht ganz so schlimm, denn er hat auch so noch genug zu tun.

Er macht sich auf den Weg. Erster Stop nach 10 Minuten: Bäcker. Zur Abwechslung (und wegen der guten Vorsätze) nimmt Herr M heute mal kein Schlemmerbrötchen (überbackenes Käsebrötchen, belegt mit Kochschinken, Käse, Salat, Tomate, Gurke, Ei und fett Remoulade) sondern entscheidet sich für ein Roggenbrötchen mit Käse.

Die Fahrt des 20km entfernten Termins kann er jetzt noch locker erreichen – wenn da nicht diese Sommerreifenschleicher vor ihm wären. Mit 40kmh auf der Landstraße (100 erlaubt!). Dabei sind die Straßen doch einwandfrei geräumt. Überholen geht nicht, da auf der gesamten Straße Überholverbot herrscht.

10:01Uhr: Herr M erreicht sein Ziel in einer Wohnsiedlung. Von geräumtem Schnee keine Spur. Er versucht also in 50cm Schneetiefe am Straßenrand einen Parkplatz zu erwischen. Dank langer Berufserfahrung kein Problem. Nun noch den Vorführlaptop aus dem Kofferraum gewuchtet – Mist, Schnee im Schuh, alles nass.

Jetzt aber schnell die richtige Klingel gesucht. Ein freundlicher, russischer Maler öffnet die Tür. Er geleitet Herr M, mitsamt seiner Frau, in sein “Büro” (Garage mit PC Arbeitsplatz). Die Temperatur war, trotz -14°C Außentemperatur, deutlich über Null! Mit zusätzlichem Elektroradiator und Heizlüfter ging es dann nach kurzer Zeit.

Schnell dem PC aufgebaut und mit Smalltalk das Verkaufsgespräch begonnen. Nach kurzer Zeit steht fest – hier ist heute mal wieder ein Abschluss fällig! Nach etwa 1,5h Vorführung sind sie quasi durch. Nun folgt nur noch der letzte und entscheidende Punkt: Die Preisverhandlung. Den Sieg so gut wie in der Tasche, hat Herr M schon wieder dieses innere Grinsen aufgelegt. In diesem Moment kommt der Partner (GBr) in die Garage. Mit 2 oder 3 gekonnten Fragen, bringt er die ganze Situation zum Kippen. Es kostet den routinierten Verkäufer Herr M sein ganzes Geschick, in den folgenden 2 Stunden die Situation noch zu retten.

Ergebnis der letzten 3,5h: Nasse Socken, Koffeinvergiftung, eine bis zum Rand gefüllte Blase und ein Handwerkertrio, welches noch mal “ne Nacht drüber schlafen” muss.

Zurück zum Auto. Den Laptop (wie gesagt: 22″, 10 Kilogramm plus Zubehör) wieder zurück in den Kofferraum. Nun ist der zweite Socken auch noch nass.

Da er nun keine Termine mehr hat, kann er sich um andere Dinge kümmern. Für einen Kunden hat er noch einen PC beim Händler seines Vertrauens bauen lassen. Herr M kümmert sich nämlich auch um kleinere Firmen und deren PCs und Netzwerke. 35km über die Autobahn und schon ist er am Ziel. Der PC ist fertig. Da Herr M nächste Woche nach München auf die “Bau” Messe muss, kauft er sich noch schnell ein kabelloses Headset von Logitech (Logitech ClearChat Wireless) und für seine Frau ne Webcam um in der Woche mit Zuhause in Kontakt zu bleiben.

Jetzt geht es ab nach Hause, denn es müssen noch ein Besuchsbericht geschrieben und ein Angebot angefordert werden. Außerdem will das Headset und die Kamera ja ausprobiert werden… Herr M bat mich, bei Gelegenheit mal einen Bericht über das neue Headset zu schreiben. Das werde ich dann auch bald mal tun. Vielleicht wenn Herr M in München ist – ich werde ihn nämlich begleiten.

Viele Grüße, Dennis

Spracherkennung mit dem PC

Heute möchte ich mich ein wenig mit dem Thema Spracherkennung am PC befassen. Da ich mich seit längerer Zeit mit diesem Thema auseinandersetze und bereits einiges an Software aus diesem Bereich testen durfte, bin ich mit meiner neuesten Testsoftware, Dragon Natural Speaking in der Variante Professional, sehr zufrieden. Der Anlass für diesen Test ist die kürzlich erfolgte Schulteroperation und die Einschränkungen, die ich zur Zeit dadurch beim Schreiben am PC habe.

Wer Windows Vista nutzt, der hat ja bereits alles, was man für eine Spracherkennung am PC braucht. Allerdings wird man dabei feststellen, dass der Frustfaktor sehr hoch sein wird. Schon das einfache Diktieren eines Textes kann dabei zu einer Qual werden. Trotz Minuten- oder gar stundenlangen Trainings, die diese Software benötigt, um sich an die Sprache des Users zu gewöhnen, ist die Fehlerquote sehr hoch. Das selbst Microsoft Angestellte in einer Pressekonferenz ähnliche Probleme hatten, lässt sich am besten mit folgendem Video veranschaulichen:

httpv://de.youtube.com/watch?v=IkeC7HpsHxo

Ich werde nun die beiden oben genannten Softwarevarianten eins zu eins gegenüberstellen. Dafür lese ich eine Textpassage unter denselben Voraussetzungen zunächst mit der Dragon Software ein, danach mit dem Vista Bordmittel. Ich werde keinerlei Korrekturen an den Texten vornehmen. Die Textpassage entnehme ich folgender Nachrichtenmeldung: http://www.netzeitung.de/wirtschaft/ratgeber/1186517.html
Diese Text enthält einige Schwierigkeiten und einiges an speziellem Vokabular.

Das Original:

Obst und Gemüse gelten eigentlich als gesund. Doch manches, was als frischer Vitaminspender auf dem Teller landen soll, hat sich bei bundesweiten Kontrollen eher als Chemiecocktail entpuppt.

Bei Kopfsalat, Äpfeln, Zuchtchampignons oder Grün- und Wirsingkohl wurde 2007 häufig die gesetzliche Grenze für Rückstände an Pflanzenschutzmitteln überschritten, wie das Bundesamt für Verbraucherschutz (BVL) mitteilte. Zerkleinertes Obst und Gemüse enthalte zudem oft Bakterien und Fäkalkeime.

Zunächst spreche ich den Text mit Dragon Naturally Speaking: (Fehler sind farblich markiert)

Obst und Gemüse gelten eigentlich als gesund. Doch manches, was als frischer Vitaminspender auf dem Teller landen soll, hat sich bei bundesweiten Kontrolle eher als Chemiecocktail entpuppt.
Salat, Äpfeln, zum Champignons oder Grünen und Wirsing Kohl wurde 2007 häufig die gesetzliche Grenze für Rückstände an Pflanzenschutzmitteln überschritten, wie das Bundesamt für Verbraucherschutz (BVL) mitteilte. Verkleinertes Obst und Gemüse enthalten zudem auf Bakterien und der Kalkeimer.

Nun die Vista Variante:

Nicht das sie gelten eigentlich ausgesondert ob das war nicht, dass wahrscheinlich dann nicht Ende auf dem Teller landen sollten beim hat sich das Weite sollte eher als Chemiecocktail lenkte

Soldat tagte. ATT und TSEM 2007 heute sieht die gesetzliche Grenze zur Ständerat hat das nichts mit unterschritten, dass das Amt für Statistik (B v. L zitiert das halte zudem aus Bakterien und sie Kalkeimer

Fazit:
an diesem kleinen Beispiel kann man sehr gut erkennen, welche großen Unterschiede es bei den diversen Softwarevarianten im Sektor Spracherkennung gibt. Ich habe übrigens den gesamten Text für diesen Eintrag mit der Dragon Software eingesprochen. Die Fehlerquote war dabei sehr gering. Der Aufwand, den ich im Vorfeld mit dieser Software hatte, belief sich insgesamt auf wenige Minuten. Ich werde diese Software nun einmal ein paar Tage testen, mir vielleicht noch ein neues Headset anschaffen und anschließend nochmal ein Resümee ziehen.

Grüße, Dennis