Продолжение пятничного банкета

Лучших - по мнению автора подборки:
плюс к совместному рисованию - возможность вставлять картинки, ролики, файлы svg; назначать пользовательские роли;
чат, аудио-(а где-то и видео-)конференции, приват - всевозможный функционал для совместных проектов.
Гугл.Документ тоже так может - docs-drawing-tool collaborative-drawing
Сфейсбучено:
Выражение понравилось в приписке: "контролировать свою холерность" (ĥoleremon на эсперанто)
("kolerikemon" надо бы, но как есть даже колоритней: "холера эдакая!")
С Хабра, для любознательных:
Как развивается "умный поиск"
Пирожки в дистрибутивной семантике
Например, «принцесса» и «пастух» гораздо менее близки, чем «пастух» и «овца»: 0.139 против 0.603, что, наверное, логично — вектора национального корпуса должны отражать суровую реальность, а не сказочный мир Г.Х. Андерсена.
Способ же расчёта глубины корреляции (диффузии) запроса и пирожка проявился практически сам собой (дёшево и сердито) как нормализованная сумма сходств каждого слова из списка X с каждым словом списка Y (стоп-слова выкидывались, все остальные приводились к нормальной форме.
Результаты поэтического поиска и порадовали, и позабавили. Например, на запрос «музыка» был выдан следующий poem-list:
[('оксане нравилось фламенко'
'олегу классика и джаз'
'они вдвоём со сцены пели'
'про лагеря и мусоров',
0.25434666007036322),
('зашлась в оргазме пианистка'
'в тумане ноты и рояль'
'а ей играть ещё фермату'
'пятнадцать тактов и финал',
0.19876923472322899),
('люблю тебя как шум прибоя'
'как тёплый ветер как стихи'
'а толика люблю как танцы'
'как поцелуи как поспать',
0.19102709737990775),
('мне снится рокот космодрома'
'и ледяная синева'
'но я не тычу это людям'
'об этом песен не пою',
0.15292901301609391),
('индийский танец зита гите'
'танцует страстно у костра'
'но не отбрасывает тени'
'сестра',
0.14688091047781876)]
(цифры в скобках - показатель "сродства")
Здесь примечательно, что слова «музыка» нет ни в одном пирожке, из занесённых в базу. Однако все пирожковые ассоциации весьма музыкальны и степень их семантической диффузии с запросом довольно высока..."
Поиграть онлайн с калькулятором семантической близости: http://ling.go.mail.ru/dsm/ru/similar
(Холера и холерик далеки в "косинусной мере", гораздо дальше, чем напр. "холера" и "зараза".
Занятно, хоть и малопонятно. Чем нам всем это грозит?
А вот чем: Хабр
У гугло-яндексов все больше инструментов по борьбе с контент-фермами.
Т.е. липовыми сайтами и фиктивными блогами, наполняемыми для галочки. Чем наполняемыми?
А жеванным-пережеванным контентом в основном. Орды "рерайтеров" переиначивают тексты,
заменяя выражения синонимами. Все лучше справляются с этим и скрипты.
А с другой стороны - все ближе программная возможность выявлять перелицованные страницы
монетизаторов, забивающих поисковую выдачу пустопорожними ресурсами.
Ну и другие не менее полезные задачи по интеллектуальному поиску "на повестке дня".
Здорово будет, когда Гугл научится т не просто заданную фразу находить в текстах,
а ответ на вопрос, по смыслу, даже если несколько другими словами.
Математическая лингвистика, такая вроде бы оторванная от жизни отвлеченная теория,
сделалась прикладной дисциплиной из самых актуальных.
На закуску: Корпус малых поэтических форм - http://poetory.ru/
|
</> |