Der Kern von Wortarten.Info basiert auf dem Part-Of-Speech-Tagger der Stanford University. Grob gesagt funktioniert das Verfahren (maschinelles Lernen) so, dass eine Software mit Texten gefüttert wird, bei denen einmal von Menschen hinterlegt wurde, welches Wort zu welcher Wortart gehört. Die Software kann dann daraus Regeln ableiten - z. B. dass nach einem Artikel mit hoher Wahrscheinlichkeit ein Adjektiv oder Nomen kommt. Dadurch können auch Wörter Wortarten zugeordnet werden, die die Software vorher noch nie "gesehen" hat. Wegen Mehrdeutigkeiten ist es für den Rechner trotzdem eine ziemlich schwierige Aufgabe und bei der Erkennung entstehen Fehler.