Форум создателей искусственных интеллектов

Сообщения участника "Виктор Казаринов"

1	2

Виктор Казаринов

create

Когда вы ожидаете появление сильного искусственного интеллекта?

05:34 29.01.2021

05:38 29.01.2021

№23

Привет всем. Вчера я поучаствовал в круглом столе группы ИИ Сообщество разработчиков систем AGI Возможно, это выложат на ютубе: siberai Модератор круглого стола задал всем один и тот же вопрос: что вы понимаете под AGI? Толстолобые яйцеголовые ученые начали наперебой формулировать ответы. Ой-ой-ой. Как там все запущеноо.. Я, как слушатель, лишь написал в чате свое мнение по данному вопросу. А оно таково: формулировать любой сложный термин - неблагодарное занятие. Что AGI, что любовь - тут нет и не будет краткой и всеобъемлющей формулировки, т.к. такие термины каждый может объяснить через большую совокупность других терминов и их связей. И тут наступает засада. Все термины у каждого индивида - чисто субъективные. И каждый их понимает по-своему, т.к. они тоже объясняются через другие термины. Какая-то бесконечная рекурсия. Я решил для себя - не буду вообще никакой сложный термин для себя расшифровывать. Интуитивно понятно и ладно. Мне достаточно определений в Википедии. Если для меня AGI - путеводная звезда, то и буду к ней двигаться. Как сказал классик: движение - все, конечная цель - ничто. Поэтому и в гадании, когда получим AGI не вижу смысла. Нужно браться и делать его. Чем я и занимаюсь много лет. И вам того же желаю (если вы, конечно, сами этого желаете).

0 | 0

Виктор Казаринов

create

Когда вы ожидаете появление сильного искусственного интеллекта?

07:14 29.01.2021

07:18 29.01.2021

№25

Цап:
Есть цель. ..Простите, но цели нет, так как она не определена.

Вот представьте, впереди светит путеводная звезда. Вы движетесь к ней, прорубая просеку в лесу как в фильме Сибириада. Звезда - цель, просека - реально проделанный путь. Но если вместо звезды будет головной фонарь паровоза быстро приближающегося поезда, то ваше движение вперед черевато попаданием под этот поезд. Поэтому если цель далека, ее плохо видно и непонятно, представляет ли она нам угрозу или благо, и никакими средствами не истолковать полную суть этой цели, то это не помешает нам двигаться к неясной цели без всякого разумного объяснения самой этой цели. Вопрос тогда можно сформулировать так: тем ли путем идете, "товарищи"? Путей достижения неясной цели может быть множество и большинство из них - тупики. В остатке: имеем неясную цель с неясными путями. Очень ясное представление?

0 | 0

Виктор Казаринов

create

Предложения/замечания/новости по движку форума

10:54 05.02.2021

№122

Я, конечно, против определенных стандартов иду, но мне лично удобно смотреть даты в правом столбце в формате: год, месяц, день, час, минуты. Т.е. слева то, что меняется реже, правее - то, что меняется чаще. Как в обычном числе - слева - старшие разряды. Можно ли изменить формат в колонке Последнее на примерно такой: 2021.02.05.15:49 ? Иначе при поиске сообщений нужно, чтобы дошло до сознания, какое сообщение самое свежее, полностью прочитать каждую дату. А при предлагаемом методе можно анализировать глазами только левую часть. В нынешней версии минуты и часы сильно мешаются, если месяц может быть уже давнишним.

+1 | 0

Виктор Казаринов

create

Филогенез и онтогенез AGI

05:28 13.02.2021

07:19 21.01.2022

№328

Цитаты из Википедии: "Филогене́з, или филогени́я (др.-греч. φῦλον, phylon — племя, раса и др.-греч. γενετικός, genetikos — имеющий отношение к рождению), — историческое развитие организмов" "Филогенез рассматривает эволюцию в качестве процесса, в котором генетическая линия — организмы от предка к потомкам — разветвляется во времени, и её отдельные ветви могут приобретать те или иные изменения или исчезать в результате вымирания." Цитата из Википедии: ".Онтогене́з (от др.-греч. ὤν, лат. on > род. ὄντος, ontos «сущий» + γένεσις, genesis «зарождение») — индивидуальное развитие организма." В данном топике мне хотелось бы обсудить и развить идеи создания сначала простых, а затем все более и более сложных и умных синтетических созданий - виртуальных или реальных (роботов). И таким образом создать "Дорожную карту" движения к полноценному AGI, а также развитие индивидов AGI и более простых синтетических созданий в процессе их функционирования для случая, если при старте он будет оснащен лишь набором дефолтной (генетической) информации. Проще говоря, здесь обсуждаем конструкции конкретных создаваемых изделий от простых к более сложным.

0 | 0

Виктор Казаринов

create

Филогенез и онтогенез AGI

07:44 13.02.2021

№340

rrr3:
И вновь тоже самое. Голый призыв к другим, а сам в кусты... Начинайте, выскажите свои мнения!

Вы наверное не поняли меня. Я никакого призыва к другим не декларировал. Хотите - обсуждайте, не хотите - проходите мимо. Я создаю топики здесь в виде логов того, что сам делаю и буду делать. В таком ключе и нужно рассматривать мой обычный инженерный подход.

rrr3:
Вот Вам для начала ещё одна затравка, раз уж Вы сами так нерешительны, типа хочется, но колется... ))) Получение АГИ путем эволюции в компах прототипов, по типу эволюции видов в природе - полнейшая глупость!!! Опровергайте!

Опровергать никого не хочу. Оставайтесь при своем мнении. Здесь буду высказывать сугубо свое личное.

0 | 0

Виктор Казаринов

create

Филогенез и онтогенез AGI

07:51 13.02.2021

№341

Prosolver:
Прототипи́рование (англ. prototyping от др.-греч. πρῶτος — первый и τύπος — отпечаток, оттиск; первообраз) — быстрая «черновая» реализация базовой функциональности будущего продукта/изделия, для анализа работы системы в целом. На этапе прототипирования малыми усилиями создается работающая система (возможно неэффективно, с ошибками, и не в полной мере). Во время прототипирования видна более детальная картина устройства системы.

Не соглашусь с вами. Я в нижних строках первого моего сообщения подразумевал, что здесь хотел бы начать рассмотрение инженерной разработки AGI не сразу с создания полноценного AGI, а с создания простейших автономных созданий, постепенно переходя к разработке более сложных и умных. Естественно, для каждого такого создания сначала нужно разработать и изготовить Минимально Жизнеспособный Продукт (MVP).

0 | 0

Виктор Казаринов

create

Филогенез и онтогенез AGI

06:25 14.02.2021

№356

rrr3:
Так я не понял, Вы обсудить хотите или просто свои мнения высказывать?

Ни то ни другое. Здесь будет лог моих работ о создании программно-аппаратных конструкций.

rrr3:
Не понял и другое. Вы об эволюции говорили в первом посте или о развитии инженерных конструкций, как в предшествующем. Мне казалось, что это разные вещи. Эволюция в биологии так или иначе подразумевает случайность и отбор. Просто постепенное развитие тоже порой называют эволюцией в противовес революции. В биологии же эволюционный процесс может проходить как медленно, так и быстро, т.е. революционно. Т.е. бирки одни, а содержание разное...

Здесь эволюцией буду заниматься я, постепенно создавая все более сложных агентов.

0 | 0

Виктор Казаринов

create

Понимание и объяснение

22:07 16.03.2021

22:25 16.03.2021

№689

Моей системе, пытающейся понять https://aigod.com/AIGodPersonalAssistant.html я задал вопрос: Ваш текст: Что такое число? Ответ: число? это: количество; И еще вот: Ваш текст: Что такое звезда? Ответ: звезда? это: астрономическое тело; Ваш текст: что такое самолет? Ответ: самолет? это: aircraft; powered vehicle; Ваш текст: что такое ветер? Ответ: ветер? это: газовое движение; Повествование: Ваш текст: лес шумел от ветра Анализ: Ваше высказывание: Тип: класс; Субъект: forest; Предикат: radiating sound; Число: единственное; Время: прошедшее; Тип: класс; Объект: wind; Ваш текст: корова ела траву Анализ: Ваше высказывание: Тип: класс; Субъект: female cow; Предикат: eating; Число: единственное; Время: прошедшее; Тип: класс; Объект: plant; В ответе не найденные слова, а узлы онтологии. Это особенно хорошо видно по такому запросу: Ваш текст: мама ела рыбу Анализ: Ваше высказывание: Тип: класс; Субъект: organism; Тип: класс; Субъект: physical; Тип: класс; Субъект: object; Тип: класс; Субъект: self connected object; Тип: класс; Субъект: corpuscular object; Тип: класс; Субъект: organic object; Тип: класс; Субъект: agent; Предикат: eating; Число: единственное; Время: прошедшее; Тип: класс; Объект: fish; Тип: индивид; Объект: fish; Я ни одного ответа не создавал. Сам не знал, что ответит программа.

0 | 0

Виктор Казаринов

create

Понимание и объяснение

11:51 17.03.2021

11:54 17.03.2021

№694

Prosolver:

Виктор Казаринов:
что такое ветер? Ответ: ветер? это: газовое движение

Правильные ответы на вопросы типа что? как? где? не демонстрируют понимания (в смысле данного топика). Они демонстрируют знания, владение понятийным аппаратом на разных уровнях абстракции (отвлечения от деталей). Если мы в тексте слово "ветер" заменим на слова "газовое движение" то мы не добавим ничего, мы только произведём тавтологическую замену, перейдём на более низкий уровень абстракции (на уровень большей конкретики).

Моя система пока лишена механизма умозаключений. Есть только онтологическая БЗ. На вход поступает текст, который синтаксическим и другими анализаторами преобразуется в граф онтологии. Его и выдет программа. Этот граф является подграфом общей онтологии. Поэтому легко без всяких сложностей можно путешествовать по всей онтологии. Таким образом автоматически можем сделать обобщение или наоборот, произвести конкретизацию. Кроме того, можно, двигаясь по свойствам, находить ассоциации. Это у человека называется метафоричность мышления. Для этого ничего специально делать не нужно. Все есть в действующей системе.

Prosolver:
Понимание же (в смысле данного топика) демонстрируется "правильным" ответом на вопросы: отчего? почему? (причинно-следственные отношения) или к чему? для чего? (следственно-причинные отношения). Если Ваша система на вопрос: "почему ветер дует?" ответит: "потому что звёздное излучение (или другой источник) создаёт в атмосфере планеты области с разным уровнем газового давления" то мы получим качественно иной ответ, это уже не будет тавтологическая замена, это будет связка двух областей знаний. И именно эта связка позволит делать умозаключения. И цепочки умозаключений (т.е. объяснения). Чего современные системы ИИ напрочь лишены.

Вот для этого и нужно лишь перейти к соседним ветвям онтологии и связать более отдаленные области онтологии между собой целенапраленным образом. Для начала ничего даже выдумывать особо не надо. Нужно лишь хотя бы прикрутить механизм перемещения по онтологии с определенными свойствами этих перемещений. Ведь более 90 процентов нашего интеллекта заключается в правильном пользовании памятью. Когда получим результаты, можно судить о том, в какую сторону двигать разработку далее.

0 | 0

Виктор Казаринов

create

Как игнорировать шум?

04:56 16.05.2021

04:57 16.05.2021

№1079

Kek:
Для решения этой проблемы я использовал следующий алгоритм: по настоящему новый сигнал тот, который повториться N раз. Только после этого ему присваивается статус новизны. Тем не менее мусор, не достигший порога повторений, тоже записывается в память, которая через какое-то время все-таки забивается. Заполнение памяти является критерием включения процедуры очистки памяти. Критерий прост: все сигналы не достигшие порога новизны удаляются и память освобождается.

В продвинутых системах можно дополнительно использовать критерий субъективной важности информации. Иногда всего один новый и неповторющийся сигнал может быть критически важен. Это - дополниельный остро селективный фильтр по отсеву шума.

+1 | 0

Виктор Казаринов

create

Проект SoundAgent

14:01 16.12.2021

14:03 16.12.2021

№3012

Привет всем. Уважуха и почет нашему с вами достопочтимому Кеку. Намедни я закодил в Андроид приложение и в браузерную страничку по технологии WebAssembly автономную распознавалку речи включая и русскую. Называется сие VOSK. https://github.com/alphacep/vosk-api Очень даже недурственно, смею доложить. Но это путь такой - взять чужое и не сосредотачиваясь на потрохах проги использовать это в другом чем-то более общем. Так я и сделал - прикрутил к альфа-версии системы понимания смысла сказанного или написанного. А к собственно первичной работе над обработкой звука в ИИ системе попробую вернуться позже, заменив чужую либу на что-то свое. Если до этого дело дойдет. конечно. Вот как-то так.

0 | 0

Виктор Казаринов

create

Проект SoundAgent

16:45 17.12.2021

16:46 17.12.2021

№3023

2Kek: Мою действующую программу распознавания слов ANNLab от 2018.01 с использованием нейросети никак не удалось использовать? Насколько я помню, там ручной работы для обучения практически не требовалось.

0 | 0

Виктор Казаринов

create

Проект SoundAgent

17:17 17.12.2021

17:18 17.12.2021

№3026

Kek:
Позже я представлю свой подход, который вообще без использования нейросетей. Это конечно дискуссионный момент. Готовлю сюжеты, терпение.

Отлично. Я, как говорил ранее, тоже работаю без нейросетей. В режиме One-shot Learning с применением онтологий.

0 | 0

Виктор Казаринов

create

Проект SoundAgent

19:53 18.12.2021

20:02 18.12.2021

№3034

Prosolver:
Kek, благодарю за любопытные лекции. Для меня новость, что фаза не важна.

Да, это так, или почти так, потому что сильно искажаются звуки речи, где есть большая атака. Второе. Фаза при ресинтезе все-таки имеет значение. Особенно это было заметно на первых синтезаторах речи, когда производилось адиттивноый синтез путем соединения ранее записанных фрагментов речи. Но!!! В экспериментах уважаемого Сергея ресинтез нужен только для контроля разборчивости. Поэтому стыки фаз между кадрами мы стараемся отфильтровать, сосредоточившись на разборчивости слов. Еще - фаза очень важна на самых низких частотах. И тут ухо легко различает сдвиг фазы основного тона. Есть у меня книга Физика музыкальных звуков. Автор Тейлор. Выпуска 1976 г. Я ее купил примерно в этом же году. Моя любимая книга по звуку до сих пор. Очень советую. Хотя, м.б. что-то в ней и устарело. В этой книге есть наглядные примеры сложения колебаний, сдвига фаз и т.д. и психоакустические эфекты этого.

Prosolver:
Из теории я бы ещё добавил, что частоту дискретизации выбирают по теореме Котельникова, которая гласит, что для точного воссоздания сигнала с частотой F, частота дискретизации должна быть не меньше 2F.

Тут вы немного не поняли Сергея. Одно дело - когда нужно со своей какой-то дискретизацией по времени порезать исходный звук во временной последовательности. Тут да, теорема Котельникова рулит. И совсем другое дело, когда производится анализ и точный поиск частот в спектре входного сигнала, т.е. в частотной области. В данном случае ошибка в точности определения будет 25 герц - шаг между дискретами частоты в диапазоне 240 интервалов. И тут я кину небольшой камешек в огород Сергея. Т.к. точность определения частоты в исходном спектре равномерна и равна 25 герц, то на низких частотах 20-200 гц получается слишком большая ошибка. Грубо говоря, левые пики из 12 главных в кадре будут сильно сдвинуты влево или вправо относительно их реального положения. И чем левее пик, тем эта ошибка больше. Еще нужно учесть эффект маскирования звука ухом. Т.е. если рядом находятся два пика сигнала, то более высокочастотный ухом будет почти неслышен. Поэтому из 12 показанных Сергеем пиков смело можно удалить несколько без существенной потери в восприятии. Но только по вышеуказанному алгоритму. Кстати, психофизические свойства слуха использует давнишний формат MP3. Почитайте его спецификацию.

0 | 0

Виктор Казаринов

create

Проект SoundAgent

08:33 19.12.2021

08:38 19.12.2021

№3037

Конечно, этот вариант хуже, чем разработки Сергея, но вот я решил выложить на сайт тестовый вариант программы автономного распознавания речи на основе VOSK. Для тестирования можно открыть страничку: https://aigod.com/speechrec/ Затем нажать на кнопку и подождать, пока загрузится русская языковая модель. Она почти 40 мб. размером. Есть, конечно и полная модель. Но она на порядок больше и на медленном интернете будет грузиться еще дольше. Текущая неполная модель содержит меньшее количество распознаваемых слов, только какой-то определенный минимум. Программа попросит разрешить работу с микрофоном. После этого можете произносить слова, фразы и видеть результат. Распознанные слова и фразы выводятся последовательно в одну строку. Чтобы очистить, придется перезагрузить страницу. Такая вот первая проба технологии WebAssembly, когда внутри браузера работает вполне серьезная программа, написанная на С/С++ с нейросетями. Я проверял в браузере Google Chrome. Если в других браузерах не будет работать, просьба сообщить об этом, если, конечно, топикстартер позволит здесь такой оффтопик. Кстати, и программу Сергея, думаю, вместе с графикой. можно упихать в браузер, но после серьезной переделки под требования данной технологии. Ведь можно и быструю 2D и 3D графику таким образом имплементировать.

+1 | 0

Виктор Казаринов

create

Проект SoundAgent

12:38 19.12.2021

12:46 19.12.2021

№3040

Kek:
Виктору вопрос. Хорошо, ты можешь пояснить как устроена модель, как заполняются вектора для нейросети, если она есть, как работает словарный запас? Это интересно.

Вот эта контора поделилась с миром: https://alphacephei.com/vosk/ На сайте можете перейти на русский язык. Поддерживает 20+ языков и диалектов - русский, английский, индийский английский, немецкий, французский, португальский, испанский, китайский, турецкий, вьетнамский, итальянский, голландский, валенсийский, арабский, греческий, персидский, филиппинский, украинский, казахский, шведский. В скором времени будут добавлены и другие. Я скачал все требуемое для данных языков. Все в открытом доступе. https://alphacephei.com/vosk/faq Гугли перевод основных пунктов: "1. В чем разница между Kaldi и Vosk. Kaldi - это исследовательский набор инструментов для распознавания речи, в котором реализованы многие современные алгоритмы. Vosk - это практическая библиотека распознавания речи, которая поставляется с набором точных моделей, скриптов, практик и предоставляет готовые к использованию функции распознавания речи для различных платформ, таких как мобильные приложения или Raspberry Pi. Если вы занимаетесь исследованиями, возможно, вам подойдет Калди. Если вы хотите создавать практические приложения с библиотекой plug and play, рассмотрите Vosk. Vosk повторно использует передовые методы точного распознавания речи из многих других наборов инструментов, а не только Kaldi. В нашем исследовании мы используем Nvidia Nemo, Fairseq и многие другие библиотеки с открытым исходным кодом. Наша цель - создать платформу для непрерывного обучения, которая постоянно улучшает распознавание речи для основных языков и вариантов использования. 2. Где взять модель получше Мы обучаем наших моделей на тысячах часов речевых данных, и они должны быть довольно хорошими «из коробки». Тем не менее, если вы ищете более точную информацию, свяжитесь с нами , мы постараемся вам помочь. 3. Как добавить поддержку нового языка Процесс построения новой языковой модели состоит из следующих шагов: Сбор данных (вы можете собирать аудиокниги с транскрипцией текста из таких проектов, как - librivoxтранскрибированные подкасты или настраивать сбор веб-данных. - Очистка данных - Модельное обучение - Тестирование" Вот собственно и софт: https://github.com/alphacep/vosk-api Я не стал разбираться с подробностями обучения, т.к. пока мне было не до того. А кому интересно, можете копнуть поглубже, благо все, кажется, с исходными кодами. Я так понял, что Vosk - это надстройка над Kaldi. https://en.wikipedia.org/wiki/Kaldi_(software) А вот и софт Kaldi: https://github.com/kaldi-asr/kaldi

0 | 0

Виктор Казаринов

create

Проект SoundAgent

12:22 20.12.2021

12:32 20.12.2021

№3051

Kek:
Короче, я демотивирован. Виктор конечно, не виноват, это не к нему мой гнев.

Егунда, как говаривал товарисч дорогой наш Ленин. Я иду примерно таким путем: получаю первичные сенсорные данные в максимально переработанном виде. Таком, чтобы данные были максимально инвариантны к пространству-времени: к дискретизации по времени, квантованию по амплитуде. Тут как раз подходит выделение пиков частот. Данных - горстка. Что. собственно и производится во внутреннем ухе человека. И над чем работаешь ты Сергей. Затем начинается главное. Либо это все потом поступает на вход нейросетки, либо машины опорных векторов. либо еще чего-то. Вот это еще что-то для меня - онтологических движок, который, собственно и занимается запоминанием, выявлением новизны и закономерностей распознаванием классов и идентификацией. Короче, занимаюсь альтернативным андерграундом по отношению к глубоким сеткам. Продемонстрированный движок распознавания речи VOSK далек от идеала по множеству причин. Поэтому есть еще над чем работать, чтобы по-настоящему связать речь с глубоким пониманием того, о чем сообщает говорящий. Ведь многого из подразумеваемого в самой речи нет. А есть искажения, пропуски и т.д. Т.е. есть нечто такое в речи, что полностью отсутствует в первичных сенсорных данных и которые наш мозг может восстановить. Точно такое же встречается и при анализе изображений. Человеческий ум извлекает из изображений информацию, явно в ней не содержащуюся, например, партийность какого-то человека. И не только статистикой покрывается проблема распознавания речи, произнесенной разными людьми.

0 | 0

Виктор Казаринов

create

Проект SoundAgent

12:35 20.12.2021

№3054

Kek:
Я хотел поделиться с публикой о "ещё что-то".

А вот об этом. пожалуйста, поподробнее. Ведь твой экспериментальный образей системы нельзя сравнивать с промышленным решением, т.к. это вещи разных весовых категорий. Твой - весомее.

0 | 0

Виктор Казаринов

create

Проект SoundAgent

12:39 20.12.2021

12:40 20.12.2021

№3055

Kek:

Виктор Казаринов:
например, партийность какого-то человека.

Я бывшего комсомольского вожака чую из далека! И это не запах.

Аха-ха. А вот тут ты и прокололся. Я всегда занимался только техникой и никогда не был причастен ни к комсомолу ни к партиям каким-то. Когда писал про партийность и дедушку Ленина, сразу подумал, что попадешься на этот крючок. И попался!!! Ура, господа капиталисты!!! Хотя тьфу на них, капиталистов. Я технократ. Сильный ИИ все равно захоботит весь мир. Ну довольно офтопика. Ждем-с продолжения видеолекций.

0 | 0

Виктор Казаринов

create

Проект SoundAgent

16:52 20.12.2021

17:22 20.12.2021

№3067

figaro:
Вон на готайке одним праздным вечером какой то хрен с горы взял да переписал код atof

Я таких самописных функций на С уже целый вагон набрал и написал, особо для импементации в микроконтроллерах. Не скажу, что на порядки быстрее, но удобнее. А ваш камень в мой огород бросаю обратно. Я лишь для того Сергею показал чужую либу. что можно что-то самописное в браузере запилить и будет работать быстро. Для себя же я пользую данную распознавалку только лишь потому, что занимаюсь более сложными ИИ вещами, например системой воображения. И у меня работает разработанная мною онтологическая система распознавания документов после однократного предъявления ей обучающего изображения документа. Поэтому насчет кодерства ваш вопрос не ко мне. Пишу только на С и в необходимых случаях на С++. Да, еще на самодельном Форте для самодельных процессоров на Верилоге. Вышесказанное, к сожалению, тоже оффтопик. Вот еще одна демка, но уже написанная мною с применением некоторых функций OpenCV прямо в браузере по пресловутой технологии WebAssembly: https://aigod.com/AuthenticatorWA/indexRemote_wa.html После загрузки нужно разрешить работу веб-камеры. И нажать внизу справа кнопку Dokumenerkennung. Затем нужно поднести к камере паспорт так, чтобы MRZ зона, расположенная внизу страницы помещалась в желтый прямоугольник. При этом если на паспорте есть фото с лицом, то оно также будет найдено и обведено прямоугольником. Но главное - это то, что вокруг букв и цифр в зоне MRZ будут появляться прямоугольники, которые прямо в браузере обнаруживаются с помощью горизонтальных и вертикальных пространственных частот. Это немного похоже на то. что продемонстрировал Сергей со звуком, т.к. тут тоже берутся максимальные пики частот в спектрах. Вот, работает в реалтайме в браузере (если у кого-то работает). Изображение паспорта никуда не отсылается. Если кто боится. распечатайте демо паспорт из википедии или еще откуда или отключите интернет во время работы с камерой.

0 | 0


1	2

Жалоба на	×

За Воздержался Против