Главная |
ЗАДАЧКА(тест Егорова на
способность системы
|
Обзоры | |
Метод | |
Слово | |
Ссылки | |
Эбаут | |
Гостевая |
Постановку задачи мы сделаем максимально неформальной, чтобы был понятен больше ее смысл, чем описанные ограничения. Существует
естественно-языковый текст. (Например,
первые семь страниц романа Толстого "Анна
Каренина".) Задача: Найти такие архитектуру системы, механизмы, методы обработки этого массива, чтобы система самостоятельно, без дополнительного обучения сгенерировало понятие "слово", специфицировало его и выделила все слова в исходном тексте. Разрешается: Вводить в систему любые правила обработки, предположения об устройстве мира и эволюции, собирать статистическую и прочую информацию с исходного текста и заниматься прочей работой. Запрещается: В явном или неявном виде задавать понятие "слово" (например, предполагать до обработки, что слово - это последовательность символов между пробелами или идти на другие "ухищрения"), иметь в "базе знаний" какие-то частные правила выделения объектов, получать информацию в систему, кроме исходного текста (например, диалог с оператором, толковый словарь и т.п.). Если, что-то непонятно (допускаю это), спрашивайте. Данная страница будет пополняться вашими ответами и вопросами, если таковые, конечно, появятся... :-) |