Вы не зашли.
Главная » PHP » Какие существуют алгоритмы поиска похожих текстов?
#1. TLENS Off (14)
Moderator
2013.12.19 23:11
В общем хочу сделать такое как на ютубе отображение похожих видео. Не знаю смогу ли объяснить свой
Сейчас у меня такой алгоритм (Автор Я):
Создал в базе данных таблицу ключевых слов. related_video со структурой key(index) | video_id
При каждом добавлении видеоролика собираю с видео ключевые слова  допустим такой файл
"Прикольный видеоролик с танцующим алкашом" тут у нас 4 ключевых слова я ищу каждое в базе ключевиков и добавляю туда в video_id в конец через запятую айди данного видео ролика.
После просто при отображении видео беру с него ключевые слова и делаю выбор с таблицы related_video
получаю допустим четыре массива идентификаторов если взять в пример ключи про бомжа.
Каждому ид присваиваю число количество индексов те количество массивов с айдишками где встречается этот ролик. После делаю сортировку и получается похожие ролики у нас те которые имеют больше всего похожих слов. Это на мой взгляд самый быстроработающий алгоритм. но самый тупой.
#2. Gemorroj Off (107)
Administrator
2013.12.20 00:12
я бы советова смотреть в сторону поисковых движков типа сфинкса. и поиск лучше будет и быстрее.
#3. TLENS Off (14)
Moderator
2013.12.20 13:01
Gemorroj И как данный модуль поможет мне в моем вопросе? У него есть алгоритм поиска похожих текстов?
#4. Gemorroj Off (107)
Administrator
2013.12.20 14:02
TLENS, в этом одна из его основных задач.
#5. TLENS Off (14)
Moderator
2013.12.20 18:06
Gemorroj Заинтересовал)
#6. Влад23 Off (0)
Участник
2013.12.20 22:10
мое мнение по тексту к видео "описанию" это не есть правильно, в первую очередь искать по загаловку названию, + сортируя если присутствует цифра, допустим 1 выше чем 23. Плюс как то отслеживать переходы на похожее видео присваевать рейтинг и выводить уже по рейтингу.  Подобная схема на ютубе, если залить сериал из 10 серий, они в похожих новостях будут появляться рандомно, сортируясь по цифрам, может 10 стоять выше чем 4 или 50 и 5 на одном уровне, спустя время когда сериал посмотрят определенное кол-вл людей похожее видео принимает статический вид. 1 серия, 2 серия , 3 серия а не 01 серия, 10 серия, 11 серия и тд
Страниц: 1
Главная
WEB
PunBB Mod v0.6.2
0.013 s