Spracherkennung mit dem Logitech ClearChat Wireless

Heute teste ich mein neues Headset, das Logitech ClearChat Wireless, mit der Software “Dragon NaturallySpeaking” auf meinem ASUS EeePC 1000H.

Nachdem ich die Systemvoraussetzungen geprüft und für ausreichend befunden habe, installiere ich zunächst die Software für die Sprachsteuerung auf dem Netbook. Nach der Installation übertrage ich das zuvor erstellte Sprachprofil von meinem Desktop PC per Netzwerk auf das Netbook. Nach dem erfolgreichen Import der Datei, muss sich lediglich das Audiosetup erneut durchführen.

Das Logitech Headset wird mit einem USB Empfänger in Form eines USB-Sticks geliefert. Die Installation erfolgt durch Plug and Play. Treiber von einer CD oder aus dem Internet sind nicht erforderlich. Ich testete dies unter Windows XP und Vista.

 

Nun zu den Ergebnissen des Tests: ein Diktat in ruhiger Umgebung führte auf Anhieb zu sehr guten Ergebnissen. Ein anschließender Härtetest in der Küche, bei laufender Spülmaschine, eingeschaltetem Wasserkocher und spülender Ehefrau zeigte nur kleinere Aussetzer. Dazu muss man noch erwähnen, dass ich für dieses Sprachprofil nur das kurze Anlernen verwandt habe. Ein längeres Training mit dieser Software wird wohl zu noch besseren Ergebnissen führen. Einen weiteren Test werde ich in den nächsten Tagen im Auto durchführen. Dies wird dann zwar ein paar verwirrte Blicke anderer Verkehrsteilnehmer zur Folge haben, doch wäre es schön, bei längeren Autofahrten nebenbei einen Blogbeitrag zu verfassen.

Übrigens: dieser Text ist rein mit Sprachsteuerung entstanden. Ich musste nur dreimal mit der Tastatur eingreifen, um Wörter zu korrigieren. Nach einem manuellen Anlernen, zum Beispiel des Wortes “Netbook”, funktionierte die Erkennung jedoch reibungslos. 

Noch ein Wort zu den Headset: es ist sehr angenehm zu tragen, die Tonqualität ist für meinen Geschmack sehr gut, die Kopfhörer kämpfen die Umgebungsgeräusche erstaunlich gut ab und das Mikrofon liefert tolle Ergebnisse. Die Funktionen lauter, leiser und stumm lassen sich direkt am Headset steuern. Zusätzlich lässt sich das Mikrofon auch durch einfaches Einklappen deaktivieren. Die Reichweite liegt, wie angegeben, bei etwa 9-10 m. Ich testete das Headset jedoch noch nicht mit der beiliegenden USB Dockingstation, in die der USB Empfänger gesteckt werden kann. Dieses Zubehörteil ist sicher für den Einsatz am Desktop PC gedacht und mit dem langen Kabel für den mobilen Einsatz eher störend als hilfreich. Der Preis des Headsets wird von Logitech mit 99 € angegeben. Ich habe jedoch im Computerladen meines Vertrauens das Headset für 69 € erstanden. Der netto Einkaufspreis beim Computergroßhandel liegt bei etwa 58 € netto.

Das sollte nun ersteinmal genügen. Ach ja, noch etwas: die Spracherkennung macht so gut wie keine Rechtschreibfehler. Lediglich die Groß- und Kleinschreibung macht hin und wieder ein paar Probleme. Gut für jeden, der in der Schule nicht aufgepasst hat. Wer hier nun doch einen Fehler findet, darf ihn behalten.

Grüße, Dennis

Spracherkennung mit dem PC

Heute möchte ich mich ein wenig mit dem Thema Spracherkennung am PC befassen. Da ich mich seit längerer Zeit mit diesem Thema auseinandersetze und bereits einiges an Software aus diesem Bereich testen durfte, bin ich mit meiner neuesten Testsoftware, Dragon Natural Speaking in der Variante Professional, sehr zufrieden. Der Anlass für diesen Test ist die kürzlich erfolgte Schulteroperation und die Einschränkungen, die ich zur Zeit dadurch beim Schreiben am PC habe.

Wer Windows Vista nutzt, der hat ja bereits alles, was man für eine Spracherkennung am PC braucht. Allerdings wird man dabei feststellen, dass der Frustfaktor sehr hoch sein wird. Schon das einfache Diktieren eines Textes kann dabei zu einer Qual werden. Trotz Minuten- oder gar stundenlangen Trainings, die diese Software benötigt, um sich an die Sprache des Users zu gewöhnen, ist die Fehlerquote sehr hoch. Das selbst Microsoft Angestellte in einer Pressekonferenz ähnliche Probleme hatten, lässt sich am besten mit folgendem Video veranschaulichen:

httpv://de.youtube.com/watch?v=IkeC7HpsHxo

Ich werde nun die beiden oben genannten Softwarevarianten eins zu eins gegenüberstellen. Dafür lese ich eine Textpassage unter denselben Voraussetzungen zunächst mit der Dragon Software ein, danach mit dem Vista Bordmittel. Ich werde keinerlei Korrekturen an den Texten vornehmen. Die Textpassage entnehme ich folgender Nachrichtenmeldung: http://www.netzeitung.de/wirtschaft/ratgeber/1186517.html
Diese Text enthält einige Schwierigkeiten und einiges an speziellem Vokabular.

Das Original:

Obst und Gemüse gelten eigentlich als gesund. Doch manches, was als frischer Vitaminspender auf dem Teller landen soll, hat sich bei bundesweiten Kontrollen eher als Chemiecocktail entpuppt.

Bei Kopfsalat, Äpfeln, Zuchtchampignons oder Grün- und Wirsingkohl wurde 2007 häufig die gesetzliche Grenze für Rückstände an Pflanzenschutzmitteln überschritten, wie das Bundesamt für Verbraucherschutz (BVL) mitteilte. Zerkleinertes Obst und Gemüse enthalte zudem oft Bakterien und Fäkalkeime.

Zunächst spreche ich den Text mit Dragon Naturally Speaking: (Fehler sind farblich markiert)

Obst und Gemüse gelten eigentlich als gesund. Doch manches, was als frischer Vitaminspender auf dem Teller landen soll, hat sich bei bundesweiten Kontrolle eher als Chemiecocktail entpuppt.
Salat, Äpfeln, zum Champignons oder Grünen und Wirsing Kohl wurde 2007 häufig die gesetzliche Grenze für Rückstände an Pflanzenschutzmitteln überschritten, wie das Bundesamt für Verbraucherschutz (BVL) mitteilte. Verkleinertes Obst und Gemüse enthalten zudem auf Bakterien und der Kalkeimer.

Nun die Vista Variante:

Nicht das sie gelten eigentlich ausgesondert ob das war nicht, dass wahrscheinlich dann nicht Ende auf dem Teller landen sollten beim hat sich das Weite sollte eher als Chemiecocktail lenkte

Soldat tagte. ATT und TSEM 2007 heute sieht die gesetzliche Grenze zur Ständerat hat das nichts mit unterschritten, dass das Amt für Statistik (B v. L zitiert das halte zudem aus Bakterien und sie Kalkeimer

Fazit:
an diesem kleinen Beispiel kann man sehr gut erkennen, welche großen Unterschiede es bei den diversen Softwarevarianten im Sektor Spracherkennung gibt. Ich habe übrigens den gesamten Text für diesen Eintrag mit der Dragon Software eingesprochen. Die Fehlerquote war dabei sehr gering. Der Aufwand, den ich im Vorfeld mit dieser Software hatte, belief sich insgesamt auf wenige Minuten. Ich werde diese Software nun einmal ein paar Tage testen, mir vielleicht noch ein neues Headset anschaffen und anschließend nochmal ein Resümee ziehen.

Grüße, Dennis