о как! а вы чё думали, Гугль дурак, да?
Nov. 5th, 2004 09:10 pm«
- берём n-мерное пространство, где n - количество уникальных слов в коллекции
- каждый документ и каждая строка поиска - это вектор в этом пространстве, где i-я координата содержит вес соответствующего слова в документе или в поиске
- чтобы сравнить документ с поиском, надо посчитать скалярный продукт этих двух векторов
»
(via Сергей Голубчук, автор полноприводного поиска в мускле)
- берём n-мерное пространство, где n - количество уникальных слов в коллекции
- каждый документ и каждая строка поиска - это вектор в этом пространстве, где i-я координата содержит вес соответствующего слова в документе или в поиске
- чтобы сравнить документ с поиском, надо посчитать скалярный продукт этих двух векторов
»
(via Сергей Голубчук, автор полноприводного поиска в мускле)
Буду признателен за ссылки на похожие документы и очень специализированные форумы по теме.