Lasst uns Namen automatisch erzeugen

Neue Vornamen für die Welt

09. Dezember 2011

Mit dem d-rhyme Wortgenerator lassen sich Worte erzeugen, die nach einer bekannten Sprache klingen. Den gibt es jetzt seit 2010 und seit ein paar Wochen „spricht” das Teil auch Italienisch, Plattdeutsch und Türkisch. Als Fun-Werkzeug für alles Mögliche oder als echtes Hilfsmittel zum Finden neuer Domains leistet der Generator gute Dienste.

Aber Namen bzw. Vornamen lassen sich damit nur schwer erzeugen. Grund genug, den zugrunde liegenden Algorithmus zu überholen und speziell so zu verändern, dass der Generator Worte erzeugt, die auch als Name was taugen. Die Idee ist simpel. Betrachtet man die meisten gängigen Vornamen, so weisen sie alle, bis auf wenige Ausnahmen, eine bestimmte Struktur auf, was männliche und weibliche Vornamen betrifft.

Nun ist das neue Feature online und produziert so elegante, weibliche Vornamen wie „Demania”, „Rigeane”, „Alisena”. Oder kraftvolle männliche Vornamen wie „Khomir”, „Zeruron” und „Gulf”. Ob solche Namen allerdings beim Standesamt durchgehen, ist eine andere Frage … Allerdings kommen beizeiten auch Konstrukte heraus, die zwar der gängigen Struktur entsprechen, aber nicht wirklich als Vorname was taugen. Niemand wird wahrscheinlich die Tochter „Diefette” oder den Sohn „Urin” nennen, gell?

Kommentare anzeigen ( 1 Kommentar )
Kommentieren

Das klingt ja wie …

Objektorientierter Wortgenerator

29. August 2010

Neben der Wort- und Reimsuche bekommt d-rhyme demnächst Zuwachs in Sachen Funktionalität. Auch wenn der Seitentitel vermuten lässt, es geht primär um Reime, so beinhaltet dieses Projekt doch mehr. Eigentlich geht es um Sprache und alle Möglichkeiten, die man aus Sicht der Informatik damit anstellen kann.

So auch das automatische Erzeugen von Wörtern, indem eine real existierende Sprache vereinfacht und objektorientiert abgebildet wird. Das ist sicherlich nichts Neues und kein Thema für eine Doktorarbeit, aber solch ein Service ist derzeit im Web nicht wirklich zu finden — wenn man von ein paar Passwortgeneratoren mal absieht, die zufälligen Buchstabensalat produzieren.

Da ich für Einfachheit anstelle komplexer Algorithmen bin, erzeuge ich in php Sprachklassen, z. B. German, die ich von einer Klasse Language ableite. Und eine Sprache besteht für mich in vereinfachter Variante nur aus Vokalen (V), Konsonanten (K) und den typischen Sprachlauten (L). Im Deutschen wären solche Laute z. B. sch, eu, ck etc. Und diese kleinsten Elemente haben wiederum Referenzen auf mögliche Folgeobjekte, und lassen sich via Generator über bestimmte Muster zu Worten aneinanderreihen. Als letzte Komponente definiere ich für jedes Sprachelement noch eine Häufigkeit, mit der es auftritt.

Zuerst „erschuf” ich Japanisch, da diese Sprache ziemlich einfach nachzubilden ist und Wikipedia die nötige Silben- bzw. Morenstruktur frei Haus liefert. Die Generatorklasse bekommt als Muster für den ersten Test (KVKVLKV) übergeben und … siehe da, hier kommt mit Yarushoji, Tayochiri, Nisachonu, Misachoji, suyachoyu etwas, das für mich als Gaikokujin irgendwie japanisch klingt.

Mitte September 2010 stelle ich das Ding unter d-labs online, wahrscheinlich mit einer vorläufigen Auswahl an Sprachen wie Japanisch, Türkisch, Französisch oder auch Latein. Stellt sich für Außenstehende noch die berühmte Frage nach dem Sinn. Was soll ich damit — mir getürktes Türkisch auf den Arm tätowieren, um später festzustellen, dass der Generator ein Schimpfwort erzeugt hat? Das vielleicht nicht, aber Kunstworte haben derzeit Hochkonjunktur. Zumindest im Web, wo Domains real existierender Wörter inzwischen rar sind und Unternehmen auf mehr oder minder gelungene Kunstworte zurückgreifen. Und wenn ein Online-Schuhgeschäft einer Namensagentur Geld spendiert, Experten wochenlang brüten und am Ende ein Wort herauskommt, das doof ist und nach Generator riecht, dann existiert für mich allein deshalb ein Sinn.