Словарь английской морфологии
Чтобы вы не думали, что я тут фигней страдал все это время, представляю вашему вниманию словарь английской морфологии aot.ru в формате БД FireBird (информации об ударениях в базе нет, только морфология). Логин/пароль к базе стандартный: SYSDBA/masterkey
Не буду останавливаться подробно на структуре базы, просто приведу пример запроса к ней, кому нужно поймет. Этот запрос для любой формы слова “KISS” вернет информацию обо всех возможных его формах:
[sourcecode language=’sql’]
select lematta_base||fm_flexia, ancode_partofspeech, ancode_grammems
from fm_sets, flexia_models, ancodes,
lematta join words_hash on wh_lemattaid=lematta_id and wh_word = ’KISS’
where lematta_fmsid = fms_id
and fm_id=fms_fmid
and ancode_id = fm_ancode
[/sourcecode]
Результат выполнения:
KISS NOUN NARR,SG KISSES NOUN NARR,PL KISS VERB INF KISSES VERB PRSA,SG,3 KISSED VERB PASA KISSED VERB PP KISSING VERB ING
На моем весьма и весьма средненьком компьютере запрос выполнился за 47ms, имхо это достаточно быстро.
Структура базы практически совпадает с схемкой изображенной в описаловке на aot.ru:
На схеме содержится ошибка: связь между FlexiaModel и Lematta изображена как один-
СКАЧАТЬ (4,5Мб)
За проделанную работу меня можно отблагодарить, купив мне пива — от баночки до пары ящиков, скинув соответствующую сумму на кошелек Z056891184532. Работа была проделана непростая, поверьте :)

Январь 9th, 2008 at 6:09 дп
спасибо огромное…жаль на вебмани сейчас полный 0!
вот на либерти бы вам пива купил…пришлите на мыло кошелек!
Январь 9th, 2008 at 8:10 дп
мегареспект ) на АВО с меня пиво ;)
Январь 9th, 2008 at 9:27 дп
Великолепно!!!
Вот что реально интересно и полезно, в отличие от десятка одинаковых анонсов партнерок и обмусоливания очередного фильтра Гугла!..
Респект!..
Январь 17th, 2008 at 7:43 дп
Для начала нужно английский изучить :)
а то VERB PRSA,SG,3 для меня мало что дает
Январь 17th, 2008 at 12:32 пп
Март 3rd, 2008 at 11:24 пп
Отличная работа проделана. Говорю как сеошник-лингвист.
Март 26th, 2008 at 3:48 пп
А зачем это делать в БД? Работает-то очень медленно, и требования по ресурсам — аццкие.
Есть замечательная переписка АОТовской морфологии, lemmatizer.org, работает мультитредно и в 10 раз быстрее. Экономична.
Кстати, в 100 раз проще использовать.
Август 6th, 2008 at 4:13 пп
Тем не менее, это решение, которое автор любезно выложил на публику. Жаль, что не в mySQL формате ;)