пятница, 5 февраля 2010 г.

29.01.2003 - 30.01.2003 Page 38

Egg 29 января, 14:41
2Inex:
то есть как без эволюционных аспектов? искренне не понял...

--------------------------------------------------------------------------------
Иван FXS 29 января, 15:02
Inex 29 января, 12:10
От языка программирования зависит мало. Гораздо больше зависит от "языка алгоритмов ", то есть такого аппарата или парадигмы (набора понятий и отношений между ними), в рамках которого разрабатываются алгоритмы.
" " " " " " " " " " " " " " " " " " " " " " " " " " " "
А пусть это будет ОДНО И ТО ЖЕ: язык программирования и "язык алгоритмов " - вот ведь о чем речь!
Более того, давайте создадим такой я зык программирования, на котором МЫ САМИ будем мыслить ... Вот это и есть постановка задачи как ИИ-задачи!!
================
А я вообще в GP не вижу ничего принципиально нового, кроме очередного хитрого градиентного спуска.
" " " " " " " " " " " " " " " " " " "
Категорически не согласен: градиентный спуск - это только один из механизмов GP, деталька такая, которую, кстати, можно не использовать ...
Вы ведь не будете утверждать, что если я из двух экземпляров оставляю тот, у которого "функционал качества " больше, то я применяю градиентный спуск?
НП, Иван FXS.

--------------------------------------------------------------------------------
X 29 января, 15:18
>Inex
Извините. Я давно здесь не был, много топика, не успел все перечитать.
Тогда не будем говорить о ИИ...
а поговорим о конкретных задачах и технологиях.

--------------------------------------------------------------------------------
Inex 29 января, 15:48
to > Egg
> >то есть как без эволюционных аспектов? < <
Лениво было длинно писать :))
Имелось в виду, рассмотрение ИИ как следующей ступени эволюции, которая вытеснит Человека и все такое прочее :))

--------------------------------------------------------------------------------
Inex 29 января, 16:10
to > Иван FXS
> >А пусть это будет ОДНО И ТО ЖЕ: язык программирования и "язык алгоритмов " - вот ведь о чем речь! < <
Угу, я понял. Но при такой постановке проблема выльется в два пункта: разработка компилятора, который будет способен программу с такого языка переводить в машинные коды и проблема разработки самого языка (который будет "языком алгоритмов "). То есть, опять же, первая проблема является проблемой реализации. А вторая остается в своей начальной формулировке.
(любую задачу все же нужно разбивать на подзадачи и решать их отдельно; в данном случае первой надо решать задачу построения "языка алгоритмов ")

> >Более того, давайте создадим такой я зык программирования, на котором МЫ САМИ будем мыслить ... Вот это и есть постановка задачи как ИИ-задачи!! < <
Вы мыслите на ЕЯ. Вывод: задача написать компилятор с ЕЯ на машинные коды. Вывод: задача сводится к созданию ИИ. По-моему, Вы таким образом даете определение проблемы через саму себя.

> >Вы ведь не будете утверждать, что если я из двух экземпляров оставляю тот, у которого "функционал качества " больше, то я применяю градиентный спуск? < <
Буду, конечно. Естественно, "градиентным спуском " я это обозвал (в смысле, дал таким образом негативную оценку). Но суть та же самая: Вы в пространстве параметров ищете глобальный максимум. Два экземпляра - это две точки в пространстве параметров, из которых Вы выбираете бОльшую. Единственное, что дают в этом смысле GP, - это порядок просмотра точек пространства, то есть, стратегию поиска. Эту стратегию можно легко описать в классических терминах и никакого GP не останется. Так что GP - это просто интерпретация в некоторых понятиях частного оптимизационного алгоритма. Естественно, в ряде приложений в рамках такой интерпретации удобно мыслить решение задачи. Но ничего нового в GP нет.

--------------------------------------------------------------------------------
Inex 29 января, 16:13
to > X
> >Извините. Я давно здесь не был, много топика, не успел все перечитать. < <
Да нет, ну что Вы. Я тут не модератор, так что мое высказывание особо серьезно вообще воспринимать не стоит.

--------------------------------------------------------------------------------
Иван FXS 29 января, 16:18
Андрей Finder Плахов 29 января, 12:57
Насчет фирмы. Грустно, господа, но уж слишком в разных городах мы все живем :))
" " " " " " " " " " " " " " " " " " " " " " " " " "
Мизерная часть проблемы заключена в этом, ИМХО ;-)

--------------------------------------------------------------------------------
Иван FXS 29 января, 16:38
2 Inex (29 января, 16:10)
Буду, конечно. ... Вы в пространстве параметров ищете глобальный максимум.
" " " " " " " " " " " "
Вопрос ведь не в том, спуск это или подъем!
Вы возражаете против ОПТИМИЗАЦИИ? :-(
НП, Иван FXS.

--------------------------------------------------------------------------------
Иван FXS 29 января, 16:58
Inex (29 января, 16:10)
> Вы мыслите на ЕЯ. Вывод: задача написать
> компилятор с ЕЯ на машинные коды.
" " " " " " " " " " " " " " " " " " " "

Неправда Ваша, я не считаю, что я мыслю на ЕЯ!
Когда я пишу/редактирую программу - я просто пялюсь в экран, набираю с клавиатуры операторы и имена переменных, да мышкой очень много шурую.
А что я при этом себе под нос мурлычу - так, слава богу, что никто этого не слышит!
НП, Иван FXS.

--------------------------------------------------------------------------------
X 29 января, 17:22
Мне в позапрошлом году подсунули пачку чеков, попросили подобрать, чтобы сумма получилась с точностью до копейки. Чеков было много и цены такие разные... На полный перебор ушлобы очень много времени. Попробовал и убедился. Тогда, в тот же день состряпал простенький генетический алгоритм. Подходящий ответ находился примерно за 10-20 итераций, т.е. мгновенно.
Чем не основа для ИИ?

--------------------------------------------------------------------------------
Inex 29 января, 18:10
to > Иван
> >Вопрос ведь не в том, спуск это или подъем! < <
Ну, допустим, я тупой. Но не полный же идиот!!?
Естественно, вопрос не в этом.

> >Вы возражаете против ОПТИМИЗАЦИИ? < <
Ну конечно же. GP - это просто ОДИН ИЗ вариантов решения задачи оптимизации. Этих вариантов - куча (Tabu Search, {GA, GP, EP, ES}, Conventional Search, Gradient Descent, различные варианты обхода дерева с разными там альфа-бетта отсечениями и т.д. и т.п., оптимизирующие нейронные сети, simulated annealing и т.д.). Я про то и говорю, что GP не является чем-то особенным. Это один из вариантов довольно-таки тупого поиска в задачах оптимизации.

--------------------------------------------------------------------------------
Inex 29 января, 18:14
to > Иван
> >Неправда Ваша, я не считаю, что я мыслю на ЕЯ! < <
Согласен. Я неудачно выразился. Вы мыслите понятиями, образами.
Выбор множества понятий, в рамках которых удобнее решать проблемы ИИ, - это та задача, которую нужно решать. И тем не менее, я все-таки считаю, что она отделяется от задачи разработки соответствующего языка программирования.

--------------------------------------------------------------------------------
Inex 29 января, 18:25
to > X
> >На полный перебор ушлобы очень много времени. Попробовал и убедился. Тогда, в тот же день состряпал простенький генетический алгоритм. Подходящий ответ находился примерно за 10-20 итераций, т.е. мгновенно.
Чем не основа для ИИ? < <
Здорово, конечно. Но что Вы подразумеваете под основой для ИИ?
Вы привели частную задачу - проблему оптимизации (есть куча вариантов ее решения, каждый из которых может оказаться лучшим в определенных рамках, так что GA, как уже говорилось, не панацея). Конечно, весь ИИ можно сформулировать в рамках оптимизационной проблемы, но это нерационально.

--------------------------------------------------------------------------------
Иван FXS 29 января, 18:31
2 Inex (29 января, 18:10)
Два короткий вопрос:
1. чем, по Вашему отличаются GA и GP? Почему Вы их перечисляете как РАЗНОЕ?
2. можно ли создавать (и - "настраивать ") ИИ-программы без оптимизации? (Понимаете ли, Ваш ответ только укрепил меня в подозрении, что Вы возражаете против ОПТИМИЗАЦИИ? ;-) )
НП, Иван FXS

--------------------------------------------------------------------------------
Комбинатор 29 января, 18:43


Не понял, если сумма заранее известна, то что нужно было подбирать?

2 Андрей Finder Плахов

Вот некоторые ссылки на англоязычные ресурсы по ИИ

1. http://www.media.mit.edu/people/minsky/

Сайт Марвина Минского, одного из основных гуру в области ИИ. Он начинал ещё в 50-ые годы, и успел поработать чуть ли не во всех областях ИИ от зрения роботов до инженерии знаний (к стати, именно им было предложена фреймовая структура представления знаний). Короче говоря, матёрый человечище, теперь таких уже не делают :) На сайте, в частности, можно найти первые 6 глав его последней, ещё не дописанной книги "The Emotion Machine ", в которой он обобщает весь свой многолетний опыт работы в области ИИ. По мере готовности, он обещает выкладывать там же и остальнык главы. Я лично прочитал первые 6 глав, что называется, "запоем ".

2. http://www.frc.ri.cmu.edu/users/hpm/

Сайт Ганса Моравека, одного из наиболее известных современных учёных, специализирующихся в области роботостроения и компьютерного зрения. Моравек автор вышедшей недавно и изрядно нашумевшей книги "MIND CHILDREN. The Future of Robot and Human Intelligance ".
На его сайте можно найти как научно-популярные статьи с конкретными прогнозами эволюции роботов на ближайшие 30 лет ( "Re-Evolving Mind " и др.), так и достаточно подробные отчёты о конкретных проектах, выполняемых в его лаборатории в настоящее время. К 2005-ому году Моравек обещает выбросить на рынок новый революционный продукт - что-то вроде стандартной "головы " с тремя глазами, которая, будучи подсоединённой к роботу или самодвижущейся тележке сможет ориентироваться в заранее неизвестном пространстве столь же уверенно, как это делают, скажем домашние животные. На сайте довольно много видеоклипов, иллюстрирующих построение трёхмерной карты местности в "мозгу " робота в реальном масштабе времени.

3. http://www.kurzweilai.net

Сайт Рэя Курцвейла, одного из самых фанатичных сторонников скорого прихода "эры ИИ ". Он известен так же как изобретатель и основатель нескольких фирм, работающих в области ИИ, на чём он уже заработал миллионы долларов. Один из самых обновляемых ИИ сайтов в мире. Новые материалы появляются практически еженедельно, а лента новостей обновляется по нескольку раз в день. Одна из самых интересных статей на этом сайте, на мой взгляд, это "The Law of Accelerating Returns ", где делается попытка обобщить закон Мура на большие промежутки времени, объяснить сам факт его существования, а так же на основании предложенной формулы спрогнозировать развитие нашей цивилизации примерно до середины XXI-го века. По моему, статья стоит того, что бы её прочитать.

На сегодня, наверное, хватит. Может быть, в ближайшие дни подкину чего-нибудъ ещё :)

--------------------------------------------------------------------------------
X 29 января, 18:44
Почему не панацея?
Разве человек разумный произошел не в процессе подобной игры генов? Разве каждый вид не является решением некоторой отимизационной задачи?
Разве в вашем мозгу только одна верная идея/гипотеза или верная выбирается/конструируется из множества рабочих.

Все зависит от способа реализации GA. Многие просто не умеют их правильно готовить, поэтому не любят. :)

--------------------------------------------------------------------------------
X 29 января, 18:50
>Комбинатор
Подбирать нужно было конкретные чеки из кучи, чтобы подшить к отчету.
Имеющиеся чеки отдельно , требуемая сумма отдельно.
Допустим чеков всего 32, тогда на каждый чек 2 бита - участвует или не участвует в суммировании. Итого 2^32 комбинаций. У меня было их значительно больше.

--------------------------------------------------------------------------------
Inex 29 января, 19:10
to > X
> >Разве человек разумный произошел не в процессе подобной игры генов? < <
Это ТУПОЙ алгоритм, НЕ интеллектуальный. Ведь на создание человека ушло 3-4 млрд лет, при этом распараллеливание было по истине чудовищным. У Вас такие ресурсы есть?

> >Разве каждый вид не является решением некоторой отимизационной задачи? < <
Является. Но (извините, повторюсь) это все равно, что строить мост, опираясь на квантовую механику --- крайне нерационально.

> >Все зависит от способа реализации GA. Многие просто не умеют их правильно готовить, поэтому не любят. :) < <
Это намек, наезд или так просто?
А не кажется ли Вам, что... хм... :))
не кажется ли Вам, что "правильно готовить " и заключает в себе ИНТЕЛЛЕКТУАЛЬНУЮ работу, а то, что делает GP, не является таковой? Я вот такой тупой (не интеллектуальный), что не могу правильно выбрать параметры (объекты, правила мутации и т.д.) для GP, при этом само GP реализовать могу, но оно не будет работать из-за первой причины. Так что, вот Вы и попались. Всю интеллектуальную работу сделали Вы в приведенном Вами примере, а GP с ИИ связано весьма косвенно.

--------------------------------------------------------------------------------
X 29 января, 20:09
>Inex
Нет наезда и в мыслях не было, это просто так - шутка из рекламы.
Я не сомневаюсь в Ваших способностях.
Действительно создание правильного ген-кода для GA - это целое искусство и я вовсе не мастер этого дела.
Однако считаю что именно в простоте реализации залог успеха.
А насчет ресурсов, просто не согласен. Требуемые ресурсы не так уж велики, компьютеры достаточно шустрые и к тому же их можно объединить в кластер. Была бы четко поставленная цель и задача.

--------------------------------------------------------------------------------
X 29 января, 20:22
>Inex
>Всю интеллектуальную работу сделали Вы в приведенном Вами примере, а GP с ИИ связано весьма косвенно.

Напротив, я только правильно(стандартно) преобразовал параметры оптимизации в бинарный код и не более того, а конструирование, комбинирование и поиск выполнял тупой алгоритм. Аналогично можно реализовать обучение(подгонку весов) либо структурную перестройку нейросети. GA это только универсальный движок для эволюции ИИ, а не сам ИИ.

--------------------------------------------------------------------------------
Egg 29 января, 23:19
to x:
[об универсальном движке]
если GA - универсальны, то хотелось бы услышать решение "моей " задачи.
Напоминаю. Есть система. На входе: естественно-языковый текст как последовательность байтов (символов). Система "имеет представление " о понятии "символ ", т.е. в какой-то базе знаний есть запись "символ ": любой байт на входе (включая знаки препинания) есть символ.
Задача: сформулировать алгоритм, работа которого приведет к разделению текста на слова и появлению в "базе знаний " нового понятия "слова ".

--------------------------------------------------------------------------------
smollett 30 января, 00:17
2Андрей
>2smollett, Egoroff
Надеюсь, что вы еще не потерялись. Что-то вас давно не слышно

Извините за долгое отсутствие, меня того уволили слегка. Надеюсь это не Егорыч накапал шефу.

Но я так почти выкрутился, готов заниматься частью относительно определения свойств И.

--------------------------------------------------------------------------------
Egg 30 января, 00:39
2smollett:
не... я не капал... я только накрошил...
рад тебя снова видеть с нами!

--------------------------------------------------------------------------------
smollett 30 января, 00:43
2Egg
Я к сожалению пока еще не совсем с вами, но бог даст к выходным приду в чуйства.
А так почитываю да поглядываю

--------------------------------------------------------------------------------
smollett 30 января, 08:01
2Egg
>давайте лучше стандарт ИИ разрабатывать, зачем эти полумеры "высокоуровневые спецификации "? :-)))

Дельная мысль как и идея создания языка алгоритмов что Иван предложил.

Далее нужно ИМХО чтоб кто-то прочесал весь форум на предмет ссылок и предложеных на рассмотрение работ.
Иван прав в том плане что найденый движок так себе но не нужно делать резких выводов. Важнее выработать протокол и идеологию сообщества движок - дело техники - деталь реализации. Для начала как всегда важна четкая постановка задачи. Чего мы хотим в функциональном плане от нашего сообщества. Определить например структуру всей этой хрени. каковы компоненты, как то собственная база знаний, система поиска, система рассылки и оповещения к примеру. причем для начала все это можно реализовывать на основе дешевых и известных решений как то списки рассылки, наборы ссылок с аннотациями, реализация поиска - типа братва а кто знает где...
и т.д. и т.п

--------------------------------------------------------------------------------
smollett 30 января, 08:12
2Андрей

Вторая часть послания Егорычу по большей части для тебя предназначена была.

--------------------------------------------------------------------------------
supremum 30 января, 08:52
to Egg 29 января, 23:19

"Задача: сформулировать алгоритм, работа которого приведет к разделению текста на слова и появлению в "базе знаний " нового понятия "слова ". "

Никакого GP(GA я не очень люблю из за требования приводить все к цепочкам) здесь не надо.
Ищите повторяющиеся цепочки символов. Чем длиннее и чаще повторяется цепочка, тем выше вероятность того, что эта цепочка является словом (если только текст не зашифрован перестановочным алгоритмом).

Вы правы. GA(GP) не универсален. Но в связке с другими технологиями GA(GP) может стать очень важным компонентом.

--------------------------------------------------------------------------------
Egg 30 января, 09:28
2supremum:
не годится...
1) текст на входе не просто конечен, но очень не велик... повторяющихся слов, в общем случае, там может и не быть...
2) Откуда у системы возьмется механизм поиска цепочки слов? это непонятно... как она сгенерировала это правли для обработки?
3) у нас нет выделенного разделителя слов... проблел - это такой же символ как и прочие (ID = 32)... плавающая рамка даже по 32К даст такое число сочетаний, что мало не покажется...

--------------------------------------------------------------------------------
Egg 30 января, 09:30
[к пред.]
правли=правило

--------------------------------------------------------------------------------
SDI 30 января, 09:48
2 Egg
>Задача: сформулировать алгоритм, работа которого приведет к разделению текста на слова и появлению в "базе знаний " нового понятия "слова ".

А на основе понятия "слово " сформулировать новое понятие "предложение "...
Как-то не логично останавливаться только на понятии "слово " -:)

Теперь по существу. Мне не понятно чем тебе не нравится статистический подход, для анализа символьного текста? Если очень обще, то это выглядит следующим образом.
Проводится статистический анализ по частотной встречаемости L-грамм (последовательность символов длиной L... снизу L ограничевается 1, сверху размером, после которого в тексте L-грамма встречается не более одного раза).
Образование новых понятий (среди них будет и понятие "слово "), в виде идентификаторов, ИИ должен формировать для обозначения подмножеств статистически выделяемых L-грамм из всего множества L-грамм.
В конце концов среди выделяемых идентификаторов также проводится статистический анализ.
Ну и т.д. и т.п. ...

В общем идеалогия анализа понятна, а вот идеалогия синтеза новых понятий еще требует осмысления -:)

--------------------------------------------------------------------------------
Egg 30 января, 09:56
2SDI:
мне не просто нравится статистический подход, я его вынужден использовать повсюду :-)))
ты предложил тоже самое, что supremum... мои замечания от 30 января, 09:28 относятся к твоему методу так же...

на понятии "слова " не нужно останавливаться... чем дальше тем круче... :-) просто это, на мой взгляд, самая простая (и достаточно сложная, и достаточно общая) задачка на обобщательные способности системы...

--------------------------------------------------------------------------------
SDI 30 января, 10:29
2 Egg
>ты предложил тоже самое, что supremum... мои замечания от 30 января, 09:28 относятся к твоему методу так же...

Ага... но когда я посылал ответ supremuma еще не видел, что касается твоих замечаний:
>1) текст на входе не просто конечен, но очень не велик... повторяющихся слов, в общем случае, там может и не быть...

В случае когда нет повторяющихся слов и повторяющихся символов, то при отсутствии "априорных " знаний -:)), задача не имеет решений...

>2) Откуда у системы возьмется механизм поиска цепочки слов? это непонятно... как она сгенерировала это правли для обработки?

Из алгоритма... Или система должна сама этот алгоритм сгенерировать? -:)

>3) у нас нет выделенного разделителя слов... проблел - это такой же символ как и прочие (ID = 32)... плавающая рамка даже по 32К даст такое число сочетаний, что мало не покажется...

В работе с L-граммами это учтено, а что касается объема обработка то без выделения инвариантов никуда не деться. Хотя ограничения сверху этот объем делает конечным -:)

--------------------------------------------------------------------------------
supremum 30 января, 10:33
-

--------------------------------------------------------------------------------
supremum 30 января, 10:44
to Egg 30 января, 09:28

Тогда у вас должно быть много маленьких текстов с указанием где в них расположены слова. Это будет база примеров.
Дальше можно конструировать с помощью GP и параметрической оптимизации нейросеть распознающую слова.

--------------------------------------------------------------------------------
Egg 30 января, 10:45
2SDI:
1) повторяющийся символов столько сколько есть... согласно частотным характеристикам...
2) Т.е. мы "знаем ", что у нас есть "слова " и начинаем их искать?!?! забавно... нет, алгоритм предполагает решение из самых общих принципов... т.е. либо "универсальный " алгоритм, либо его генерация...
3) нет... я уже сказал, если у нас нет предопределенного выделения слов, то нас ожидает комбинаторный взрыв... т.е. теоретически это работает, а практически требует бесконечного ресурса...

--------------------------------------------------------------------------------
Egg 30 января, 10:47
2supremum:
нет у нас примеров... есть 32К байтового потока... определить, что в этом 32К есть понятие "слово " и есть задача...

--------------------------------------------------------------------------------
SDI 30 января, 10:54
2 Egg
>2) Т.е. мы "знаем ", что у нас есть "слова " и начинаем их искать?!?! забавно... нет, алгоритм предполагает решение из самых общих принципов... т.е. либо "универсальный " алгоритм, либо его генерация...

Нет мы не знаем, что у нас есть понятие "слово ", но среди идентификаторов, которые обозначают подмножества L-грамм у нас может быть такое которое соответствует этому понятию, наряду с такими как слоги, знаки препинания и т.д.

>3) нет... я уже сказал, если у нас нет предопределенного выделения слов, то нас ожидает комбинаторный взрыв... т.е. теоретически это работает, а практически требует бесконечного ресурса...

На объемах текста, где сформируются устойчивые идентификаторы, бесконечного ресурса не потребуется...

--------------------------------------------------------------------------------
Egg 30 января, 11:01
2SDI:
да нет у нас такого разделения L-грамм... Это задача синтеза, а не анализа... нет ни слогов, ни окончаний, ни представления о разделителе... нет даже представления о том, что байтовый массив имеет "организацию "... есть только стакан с этими 32К байтов и есть система, которая имеет набор операций над стаканом... надо, чтобы через (...) времени работы система выдала: в стакане есть такие сущности как "слова ", признаком слова является то-то и то-то...
и надо рассказать нам всем о принципах такого рода обработки и архитектуре такой системы...

--------------------------------------------------------------------------------
SDI 30 января, 11:11
2 Egg
>да нет у нас такого разделения L-грамм...

Да понимаю я что у нас нет никаких понятий кроме символа, я так же понимаю, что у нас нет априорного разделения L-грамм, но это разделение производит анализ по статистическим критериях создавая подмножества, идентификаторы этих подмножеств при достаточной статистике и будут соотвествовать новым понятия: слоги, знаки препинания, пробел, слово и т.д. Как из них выделить именно подмножество соответствующее непосредственно "слову ", это уже конкретная задача и она должна быть привязана к задаче более высокого уровня чем просто выделение подмножеств L-грамм текста...

--------------------------------------------------------------------------------
SDI 30 января, 11:22
Как из них выделить именно подмножество соответствующее непосредственно "слову ", это уже конкретная задача и она должна быть привязана к задаче более высокого уровня чем просто выделение подмножеств L-грамм текста...
Другими словами, система может выделить все подмножества которые статистически она наблюдает, и указать характеристики этих подмножеств, а какие из них тебе нужны: слова или знаки препинания или еще что, без дополнительных требований она сформулировать не сможет... это же очевидно...

--------------------------------------------------------------------------------
Egg 30 января, 11:25
2SDI:
хорошо... предположим... (только предположим, не более)
ответь мне, пожалуйста, как ты в распределениях выделишь все эти понятия? Ведь ты даже не имеешь правила, по которому натягивать рамку L-граммы на список символов :-)))
единственно, что тебе удастся получить - это частотные характеристики символов... всё... сам подумай :-)))

--------------------------------------------------------------------------------
Egg 30 января, 11:28
2SDI:
да нет в этих 32К подмножеств... ты любые подмножества можешь нарезать... любые!!! все возможные сочетания...

> без дополнительных требований она
> сформулировать не сможет... это же
> очевидно...

для меня не очевидно... более того, без такого механизма в ИИ не будет "мышления "... будет только анализирующий что-то по "априорным знаниям " калькулятор...

--------------------------------------------------------------------------------
SDI 30 января, 11:30
2 Egg
Ухожу на ученый совет...
ответить постараюсь вечером или завтра

--------------------------------------------------------------------------------
supremum 30 января, 11:31
to Egg 30 января, 11:01
2SDI:
"...система выдала: в стакане есть такие сущности как "слова ", признаком слова является то-то и то-то... "

Что, изначально нет даже формального определения, что такое слово? Как система поймет, что вам нужно? По мимике вашего лица?

--------------------------------------------------------------------------------
Egg 30 января, 11:36
2supremum:
угу... нет формального определения... я не требую, чтобы сгенерированную сущность Она назвала "словом ", пусть это будет сущность ID = 777, неважно...
Система не должна понимать, что мне нужно... система должна уметь обобщать и заниматься эволюцией своего понятийного пространства...

> По мимике вашего лица?
я так понял, что это тонкая ирония :-)))

--------------------------------------------------------------------------------
Андрей Finder Плахов 30 января, 11:40
2Egg

Вот мое мнение по поводу твоей задачи.
1) 32K, скорее всего, не хватит.
2) Кроме знания того, что такое "символ ", система должна знать, что порядок их расположения что-то значит. Условно говоря, она должна производить анализ послед-ности так, как будто первые символы стоят "раньше ", а следующие - "за ними ", а не наоборот.
3) Система понимает, что такое "слово ", когда понимает, что последовательность символов, разделенных №32, имеет более важное значение. Поскольку такая система никакой "целью " не располагает, значение здесь - это важность для внутренней организации входа.
Статистический вход может "рассказать " нам, какие именно последовательности сильнее коррелируют с последующим входом (то есть, предположительно, влияют на него). Подавляющая их часть (если говорить об английском языке; русский в этом смысле сложнее) ограничена пробелами слева и справа. Система делает смелый вывод: давайте-ка считать самостоятельной сущностью все, что ограничено пробелами слева и справа.

Для того, чтобы действия по такой схеме не были "вымученными ", 32К текста не хватит. Думаю, минимум метров 20 надо.

--------------------------------------------------------------------------------
Иван FXS 30 января, 11:47
Egg 29 января, 23:19

> [об универсальном движке]
> если GA - универсальны, то ...
" " " " " " " " " " " " " " " " " " " " " " "
Что значит "универсальны "? GA - это метод МОДИФИКАЦИИ некоторых "экземпляров " в пределах некоторого заданного ПРОСТРАНСТВА экземпляров.
1. GA не может работать, пока не задано это пространство.
2. Если задано пространство "сипулек ", то в результате работы GA - ну никак не может быть получена "глокая куздра "!
3. GP - это метод модификации АЛГОРИТМОВ. То есть здесь в качестве "экземпляров " выступают алгоритмы, и пространство должно быть задано - алгоритмов. Но - опять же - GP в пространстве алгоритмов сипуляции не может "выйти " на куздровый алгоритм ...

---------------------------
> хотелось бы услышать решение "моей " задачи.
> Напоминаю. Есть система. На входе: естественно-языковый текст как последовательность байтов (символов).
> Система "имеет представление " о понятии "символ ", т.е. в какой-то базе знаний есть запись "символ ": любой байт на входе (включая знаки препинания) есть символ.
> Задача: сформулировать алгоритм, работа которого приведет к разделению текста
> на слова и появлению в "базе знаний " нового понятия "слова ".
" " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " "
Egg, право слово, Ваша задача меня убивает!
1. в какой такой "базе знаний " есть запись "символ "? Почему не сказать проще - СЛЕДУЕТ (априорно ;-) ) трактовать входной поток как последовательность символов?
2. (((кстати, в уникоде символ - это не байт, а, если не ошибаюсь, ДВА байта ...)))
3. Научить НС (нейронную сеть) ФИКСИРОВАННОЙ структуры разбивать текст на слова, - я думаю, совсем не сложно ... Но только - ее нужно будет ТРЕНИРОВАТЬ! (Например, подавать на вход текст как целое, а на выходЫ - исхитриться как-то - этот же текст, но разбитый на слова ...)
4. А вот ежели мы хотим, выбрать НАИЛУЧШУЮ (в некотором смысле) НС, решающую эту задачу, - то нам без GP не обойтись ... А пример того, как можно применять GP к модификации НСетей - смотрите в постерах коллеги supremuma. (Скромненько так: я тоже этим занимаюсь, но задачу у меня - уж больно специфическая ...)
5. Таким образом, первая половина ( "задача: сформулировать алгоритм, работа которого приведет к разделению текста на слова ") - вполне "обозрима " ...
6. ... а вот вторая: ``и появлению в "базе знаний " нового понятия "слова " '' - это прямо аут какой-то! У Вас что ли в каждом "алгоритме ", который Вы делаете, присутствует "база знаний "?
7. Что касается "понятий " - так это вообще атрибут НАИБОЛЕЕ ВЫСОКО ОРГАНИЗОВАННОГО МЫШЛЕНИЯ! У людей-то - не у всех "понятия " имеются!!
8. И я совершенно не допускаю, что "понятия " могут ПОЯВИТЬСЯ в процессе обработки набора символов объемом 32К. Люди, например, получают понятия В ПРОЦЕССЕ ОБУЧЕНИЯ, то есть в них эти понятия ТРАНСЛИРУЮТСЯ, (=ВНЕДРЯЮТСЯ) в результате сложно-организованного процесса ПРОИЗВОДСТВА человека из несмышленого человеческого детеныша ... (Шутка. Спросите у ребенка: кто тебя научил включать свет? Он ответит: как это кто, я САМ научился ... ;-) )
НП, Иван FXS.

--------------------------------------------------------------------------------
Egg 30 января, 11:52
2Андрей Finder Плахов:
это забавно, конечно, без какой_бы_то_ни_было цифры в руке спорить: 32К или 20М... :-)))
с пафосом твоего поста согласен... но есть такое замечание:

> порядок расположения что-то значит...

можно усложнить задачу, отсканить страничку текста и запустить в систему, но не в виде двумерной матрицы, а одномерно, например, со разверткой по строкам... тогда порядок будет несколько сложнее :-))
соглашусь с такой трактовкой: система должна иметь "представление " о понятии "порядка "...

--------------------------------------------------------------------------------
Андрей Finder Плахов 30 января, 12:03
Egg
Ну ты даешь. Я никогда не соглашусь с идеей создания изучающей системы, которая не знает об изучаемом объекте вообще ничего. Это ведь... сейчас я сматерюсь... это ведь так НЕПРАКТИЧНО и НЕЭФФЕКТИВНО!

Я пока что борюсь именно за то, чтобы научить систему использовать информацию-подсказки в достаточно общей форме... А ты говоришь "никаких подсказок. баста. "

Вот ты обладаешь интеллектом? Открой бинарный текст dll-ки и попробуй понять, что существует понятие export table... Нет, еще хуже. Не ты (ты это и так знаешь), а твой сын(дочь? внук?) в шестилетнем возрасте (главное, чтобы читать мог уверенно).

--------------------------------------------------------------------------------
Egg 30 января, 12:03
2Иван FXS:
на хрена нам юникод? :-) два байта на символ - это следующий этап усложнения задачи... для любителей натягивания рамок :-)))

> У Вас что ли в каждом "алгоритме ",
> который Вы делаете, присутствует "база > знаний "?

у меня нет, но я привел тестовую задачу, которая была бы полезна тем, кто ставит задачу "искусственного мышления "... она проста в форумлировке, отчасти элегантна и ее очень, очень, очень трудно решить... :-)

Тренировать систему нельзя... она должна дойти сама, своим умом :-))) то, что человек приходит к мышлению в результате научения еще не означает того, что процесс мышления невозможно организовать иначе... Более того, это один из решающих "экспериментов " в моей модели эволюции... я уже говорил, что на мой взгляд законы мышления носят объективный характер и не зависят от аппаратной реализации...

Комментариев нет:

Отправить комментарий