Das klingt ja wie …

Objektorientierter Wortgenerator

29. August 2010

Neben der Wort- und Reimsuche bekommt d-rhyme demnächst Zuwachs in Sachen Funktionalität. Auch wenn der Seitentitel vermuten lässt, es geht primär um Reime, so beinhaltet dieses Projekt doch mehr. Eigentlich geht es um Sprache und alle Möglichkeiten, die man aus Sicht der Informatik damit anstellen kann.

So auch das automatische Erzeugen von Wörtern, indem eine real existierende Sprache vereinfacht und objektorientiert abgebildet wird. Das ist sicherlich nichts Neues und kein Thema für eine Doktorarbeit, aber solch ein Service ist derzeit im Web nicht wirklich zu finden — wenn man von ein paar Passwortgeneratoren mal absieht, die zufälligen Buchstabensalat produzieren.

Da ich für Einfachheit anstelle komplexer Algorithmen bin, erzeuge ich in php Sprachklassen, z. B. German, die ich von einer Klasse Language ableite. Und eine Sprache besteht für mich in vereinfachter Variante nur aus Vokalen (V), Konsonanten (K) und den typischen Sprachlauten (L). Im Deutschen wären solche Laute z. B. sch, eu, ck etc. Und diese kleinsten Elemente haben wiederum Referenzen auf mögliche Folgeobjekte, und lassen sich via Generator über bestimmte Muster zu Worten aneinanderreihen. Als letzte Komponente definiere ich für jedes Sprachelement noch eine Häufigkeit, mit der es auftritt.

Zuerst „erschuf” ich Japanisch, da diese Sprache ziemlich einfach nachzubilden ist und Wikipedia die nötige Silben- bzw. Morenstruktur frei Haus liefert. Die Generatorklasse bekommt als Muster für den ersten Test (KVKVLKV) übergeben und … siehe da, hier kommt mit Yarushoji, Tayochiri, Nisachonu, Misachoji, suyachoyu etwas, das für mich als Gaikokujin irgendwie japanisch klingt.

Mitte September 2010 stelle ich das Ding unter d-labs online, wahrscheinlich mit einer vorläufigen Auswahl an Sprachen wie Japanisch, Türkisch, Französisch oder auch Latein. Stellt sich für Außenstehende noch die berühmte Frage nach dem Sinn. Was soll ich damit — mir getürktes Türkisch auf den Arm tätowieren, um später festzustellen, dass der Generator ein Schimpfwort erzeugt hat? Das vielleicht nicht, aber Kunstworte haben derzeit Hochkonjunktur. Zumindest im Web, wo Domains real existierender Wörter inzwischen rar sind und Unternehmen auf mehr oder minder gelungene Kunstworte zurückgreifen. Und wenn ein Online-Schuhgeschäft einer Namensagentur Geld spendiert, Experten wochenlang brüten und am Ende ein Wort herauskommt, das doof ist und nach Generator riecht, dann existiert für mich allein deshalb ein Sinn.