gipa: (Default)
gipa ([personal profile] gipa) wrote2004-11-12 06:23 pm

(no subject)

Вот у меня голоса нет. Никакого. Слух, вроде, есть, то-есть фальш замечаю, а петь не умею.
И рисовать не умею. Вот такой уж родился бесталанный.
Это преамбула.

А амбула вот в чём.
Придумалось мне такое:
Вот есть, например Гугль. Хорошая штука.
Ищет слова, картинки (по ключевым словам), музыку (опять-таки, по ключевым словам).
А вот как сделать такое, что-б я своим безголосым голосом чего-нить нагудел в микрофон, или своими левыми ножками накалякал и отсканил, засунул в Гугль, а он мне в ответ - ага, дык это-ж 9-я симфония или Мона-Лиза.

Есть среди моих френдов кто-то достаточно вумный?

[identity profile] edenc.livejournal.com 2004-11-12 08:31 am (UTC)(link)
Я видела сайт, где что-то вроде этого реализовано, на форуме http://forums.lifanovsky.com/ , только ссылку потеряла . Зайдите туда и спросите.

[identity profile] edenc.livejournal.com 2004-11-12 08:32 am (UTC)(link)
т.е. я видела на форуме не сайт, а ссылку на него.

[identity profile] jorjetta.livejournal.com 2004-11-12 08:32 am (UTC)(link)
ыыгыгы, а у меня и слуха нет:)
но зато ты вумный, а меня вот даж мозгами обделили,совсем немного подкинули, ну что б совсем с голода не сдохла:)

[identity profile] simonka.livejournal.com 2004-11-12 08:33 am (UTC)(link)
я неумная

[identity profile] lenoteni.livejournal.com 2004-11-12 11:33 am (UTC)(link)
И я давно мечтаю о таком поиске!

[identity profile] riftsh.livejournal.com 2004-11-12 11:38 am (UTC)(link)
http://www.soundfisher.com/

http://www.cs.bris.ac.uk/home/janko/journalclub/ron5.pdf
http://www.phys.waseda.ac.jp/shalab/~kenji/pdf/AST2002.pdf
http://www.phys.waseda.ac.jp/shalab/~kenji/pdf/EngMus-II.pdf

[identity profile] gipa.livejournal.com 2004-11-12 01:40 pm (UTC)(link)
http://www.soundfisher.com/
SoundFisher is not intended as a search mechanism for music catalogs. The automatic sound-analysis techniques and the resulting attributes that are extracted -- particularly the "sounds-like" properties -- are not musically oriented. In other words, they do not address sound at the level of the musical phrase, melody, rhythm or tempo. It is also not adapted to speech recognition or speaker identification tasks, although occasionally and under very specific (usually impractical) situations, SoundFisher may provide some utility for music and speech-related sound management.

А из остальных - последний самый интересный, и ближе всего к тому, о чём я подумал.
Спасибо.
:)

[identity profile] sartoris.livejournal.com 2004-11-12 02:27 pm (UTC)(link)
Ну шаблонный анализ звука я еще могу себе представить... С выпремлением, дополнением, и прочими прелестями. Но с Лизой не получается как-то: глаза куда чаще "врут", чем уши:(

(Anonymous) 2004-11-16 02:58 pm (UTC)(link)
Hmmm... вот если бы довольно неплохо нарисовал бы, то с помощью Neural-Networks можно было бы найти оригинал (из зарание preprocessed базы-данных).
Если бы была у меня такая база-данных (картин), и месяц другой тренироваться с этим, то думаю можно было бы добиться не плохих результатов. Идея мне понравилась. ...вот только времени нет... может летом (если мне напомнят, и базу-данных предоставят)
По поводу звука, это уже намного сложнее...

P.S.

(Anonymous) 2004-11-16 03:06 pm (UTC)(link)
Забыл сказать... preprocessing я сам сделать не смогу - для этого нужет спец. по работе с графикой. Каждую картинку надо перевести в grey-scale, сжать до fixed-size, например 50x50 пикселей (это и я с Photoshop могу сделать), но потом надо убрать незначительные детали - а это уже не я... :)

[identity profile] gipa.livejournal.com 2004-11-16 09:51 pm (UTC)(link)
А кто и куда должен напомнить? :)
К тому-же (по поводу поста ниже) это должно делаться автоматически, как со словами. Если каждую картинку обрабатывать вручную - не имеет смысла.

(Anonymous) 2004-11-17 12:58 am (UTC)(link)
Конечно не вручную - но надо ведь программку, которая бы это делала написать (и желательно с минимум искожений).

> А кто и куда должен напомнить? :)

Если будет еще актуально, то напомнить можно ближе к лету (начало Июля). E-mail: NN@organizermp3.com

P.S.

(Anonymous) 2004-11-17 02:42 am (UTC)(link)
По идее это будет выглядеть так:

1) Берем много картинок.
2) Делаем preprocessing по всем (как описано выше).
3) Тренеруем NN (Neural-Network) с искаженнымми картинками (много шума, например, но все-таки чтобы можно было узнать).
4) Когда готово, рисуем, сканнируем, и hopefully должно работать :)

[identity profile] riftsh.livejournal.com 2005-01-07 02:48 am (UTC)(link)
http://www.livejournal.com/users/starina_hank/16798.html ;)

[identity profile] gipa.livejournal.com 2005-01-07 06:17 am (UTC)(link)
Great minds think alike :)