В каких случаях, при наличии поиска с морфологией, антранслитом и синонимами по некоторому массиву информации вам, как пользователю, нужно было бы уметь навешивать категории (не люблю слово "теги") на куски информации из этого массива?
Мне пока совсем это неочевидно.
NB: Можно приводить примеры из любой области, т.е. про любой массив информации, мне интересны все варианты.
← Ctrl← Alt
Ctrl →Alt →
October 28 2005, 19:53:21 UTC 6 years ago
Типа "радиатор как кулер" vs "радиатор как автозапчасть" vs "радиатор как батарея в доме"? Это, видимо, по контексту можно дополнительными ключевыми словами добить.
Хотя группировать результаты поиска по темам, как это делает teoma, иногда очень удобно. Но нечасто.
October 28 2005, 20:09:34 UTC 6 years ago
Приведи пример массива информации, на который ты не понимаешь, как можно было бы навесить категории.
6 years ago
6 years ago
6 years ago
6 years ago
6 years ago
6 years ago
6 years ago
6 years ago
6 years ago
6 years ago
6 years ago
6 years ago
Anonymous
October 28 2005, 19:55:23 UTC 6 years ago
Если я повесли 2 тага: tech и fun, то это означает, что это смешно для технарей. И как составить поисковый запрос на такую вещь я придумать ну никак не могу.
October 28 2005, 19:56:50 UTC 6 years ago
6 years ago
6 years ago
6 years ago
October 28 2005, 20:01:49 UTC 6 years ago
October 28 2005, 20:08:36 UTC 6 years ago
6 years ago
6 years ago
6 years ago
6 years ago
2 years ago
6 years ago
October 28 2005, 20:03:57 UTC 6 years ago
у меня так достаточно часто получается
October 28 2005, 20:07:24 UTC 6 years ago
6 years ago
6 years ago
6 years ago
6 years ago
6 years ago
6 years ago
6 years ago
6 years ago
6 years ago
October 28 2005, 20:06:29 UTC 6 years ago
Яховский myweb мне лично уже сейчас ощутимо помогает в ежедневном поиске по обычному вебу. Практически любой запрос приводит к тому, что обнаруживаются страницы с соответствующими тэгами, к которым доверия больше и от которых больше пользы.
А если говорить о действительно произвольном массиве информации, то всё совсем очевидно. Мой фотоархив в 20000 файлов с именами в 8 символов не имеет никакой ценности без системы категорий, которая на него натянута.
October 28 2005, 20:16:02 UTC 6 years ago
---
Про пример с фотоархивом спасибо, действительно, я пока только про текстовые массивы.
6 years ago
6 years ago
6 years ago
6 years ago
6 years ago
6 years ago
6 years ago
6 years ago
6 years ago
6 years ago
6 years ago
6 years ago
October 28 2005, 20:10:22 UTC 6 years ago
October 28 2005, 20:13:38 UTC 6 years ago
См. news.yandex.ru например, раздел "Интернет".
---
> По крайней мере, категории это сильно упрощают даже при наличии поиска.
То есть тебя не волнует полнота, да? Потому что ясно, что 70% потока не категоризировано авторами, а остальные 30% категоризированы десятками разных тагов.
6 years ago
6 years ago
6 years ago
6 years ago
October 28 2005, 20:11:21 UTC 6 years ago
Если же речь о результатах поиска, то метки бы пригодились, когда результаты сохраняются, чтобы к ним можно было вернуться.
October 28 2005, 20:17:46 UTC 6 years ago
Если что в качестве дополнительного параметра?
6 years ago
October 28 2005, 20:25:12 UTC 6 years ago
October 28 2005, 20:26:42 UTC 6 years ago
А вот про текстовую попробуй придумать пример, это будет интересно.
6 years ago
6 years ago
October 28 2005, 20:29:34 UTC 6 years ago
October 28 2005, 20:40:17 UTC 6 years ago
October 28 2005, 20:34:58 UTC 6 years ago
Итак, есть у нас масиив данных. Так? Так.
Итак, есть у нас инструмент поиска по нему. Этот инструмент изощрен и очень сложен и таким образом позволяет при грамотном построении запроса (или все же просто при любом запросе?) найти абсолютно все, что нужно и при этом результаты будут максимально релевантны. Так?
Итак, есть у нас еще и инструмент навешивания категорий на отдельные куски из массива. Так? Так.
Вопрос: Зачем нам этот инструмент категоризации?
Я правильно вас понял?
October 28 2005, 20:37:53 UTC 6 years ago
6 years ago
6 years ago
6 years ago
October 28 2005, 20:35:20 UTC 6 years ago
Иначе всё скатится к поиску по ещё одному атрибуту, а не отбору по фильтру, коим категория-тег и является.
Кстати, может - возможность поиска юзеров с похожими категориями-тегама?
October 28 2005, 21:09:50 UTC 6 years ago
кстати если, наприер, в объёме (ну и формате) del.icio.us, то можно очень подробный и правилный список alias получить. ну просто очень.
6 years ago
6 years ago
6 years ago
6 years ago
October 28 2005, 20:37:35 UTC 6 years ago
October 28 2005, 20:50:34 UTC 6 years ago
6 years ago
6 years ago
6 years ago
6 years ago
6 years ago
October 28 2005, 20:43:49 UTC 6 years ago
есть фильм "Х", какдры которого я пытаюсь найти. поскольку "X" имеет свое значение в нескольких областях науки, есть н книг дефолт и игрек песен, и двадцать блюд и напитков с таким названием, я дополнительно ввожу, что меня интересует записи из всего, что помечено как "кино".
или совсем живой пример.
представим что есть некая программа (организация, блюдо, итп) far (away, for, once) и мы не знаем конкретно что она делает (из чего состоит, сколько стоит, как готовится).
http://www.google.com/search?client=ope
найти что-либо становится не простой задачей. встречался с таким в жизни.
есть предположение, что морфология, антранслит итп средства увеличивают возможности (мощь?) поиска. а категории сводят в минимум нежелаемые варианты. то есть кулинария, десерты, торты, рецепты "X" приведут меня как ищущего к рецепту торта "X".
фактически как аналог с библиотекой. есть сто авторов на букву Ы. а если их разбить по жанрам останется по 5-15 на жанр. что несомнено при определенных знаниях облегчит поиск.
October 28 2005, 20:45:31 UTC 6 years ago
2. когда теги назначаются автоматически -- как на gmail. Например все письма, содержащие в subj слова login, account, password у меня автоматически получают тег password, а все, что приходит с LJ -- тег "LJ comment".
Вручную же назначать теги чтобы потом самому же по ним что-то искать -- это онанизм IMHO.
October 28 2005, 20:53:31 UTC 6 years ago
Это, кстати, большая проблема всех вики-сайтов. Пришедший левый читатель сразу теряется, непонятно что вообще здесь можно найти. Как книга без оглавления, но с индексом.
Теги нужны не для поиска, а для выборочного чтения по теме, причём разбиение на темы задаётся автором, который в собственной информации ориентируется гораздо лучше читателя. Они не панацея, но помогают сильно.
October 28 2005, 21:12:52 UTC 6 years ago
А чем поиск по теме "хостинг" отличается от "выборочного чтения" по кейворду "хостинг"?
6 years ago
6 years ago
6 years ago
6 years ago
October 28 2005, 21:14:47 UTC 6 years ago
October 28 2005, 21:16:32 UTC 6 years ago
2. краткая подборка интересного именно мне из большого объёма точно относящегося к теме поиска
3. не все таксономии, нужные пользователям, предусмотришь. можно поразмышлять над примерами, но для начала см. дискуссию про Rollyo.com.
А вообще, главная причина для создания тегов -- страшная дешевизна за сопоставимую с умными автоматами полезность.
October 28 2005, 21:31:47 UTC 6 years ago
October 28 2005, 23:42:22 UTC 6 years ago
Например, на любимом dirty.ru в ссылках про политику, к счастью, почти никто не употребляет собственно словоформы от корня "полит". Но если бы мы задались целью найти все так или иначе тематические ссылки, то скрытая, чтоб не портить концепцию, категория "политика" нам бы в этом помогла.
October 29 2005, 01:51:45 UTC 6 years ago
На примере букмарксервиса.
Окружить ссылку метками - значит составить персональный набор векторов для последующего поиска. Это лучше обычного поиска тем, что автор совсем не обязательно имеет в тексте слова, которые я понимаю также как и он, а еще я пишу метки на русском, а текст например на английском.
October 29 2005, 03:42:13 UTC 6 years ago
October 29 2005, 08:07:32 UTC 6 years ago
тему придумаю в конце
Общественность сместила свой интерес в область поисковых машин. Давайте попробуем посмотреть свысока вообще на процесс поиска. Есть массив информации. Для реализации поиска по этому массиву выбирается единица этой информации и определяются ее отличительные особенности от других единиц. В случае поисковых машин в сети единицей выступает слово (пусть условно будет так), которое состоит из букв (известных и в обозримом будущем неизменных). (Насколько мне известно Яндекс в процессе индексации делает морфологический разбор и заносит некоторый ID слова к себе в индекс а не само слово, и я думаю так делают многие ПС). Таким образом в поисковой машине уже заложена изначально классификация по словам. Надо сказать это классификация очень низкого уровня. Но и ПС вещи очень широкого применения.Когда вы заходите в книжный магазин вы видите полки с надписями (Фантастика, Современная Проза и т.п.) Это классификация более высокого уровня.
Таким образом ответ на твой вопрос:
Всегда, когда использование кластеризации/классификации/разделения будет оправдано.
Когда это может быть оправдано? 1. Чаще всего когда это сэкономит время на поиск.
2. Когда даст новое *понимание* самого массива информации.
В вузе не зря заставляют зазубривать классификацию это дает человеку знание обо всех изучаемого предмета. Вспомните, что сделал Менделеев изобрев свою таблицу. Я по образованию металловед и могу сказать что своиства сплава очень сильно зависят от положения в таблице Менделеева элементов которые в этот сплав добавлены. И элементы стоящие пососедству нередко дают схожие свойства.
Utx и подобные очень удобны для редакторов газет. "Чтобы написать статью, нужно написать много заметок" сказала однажды мне главный редактор вузовской газеты. А заметки мы пометим спец. метками руководствуясь устройством своих мозгов. И это нам потом поможет сэкономить кучу времени.
Заметьте это касается любого массива информации и любого способа ее классификации. Фото, видео, звук. Даже классификации можно классифицировать.
October 29 2005, 09:41:26 UTC 6 years ago
Re: тему придумаю в конце
> своиства сплава очень сильно зависят от положения в таблице Менделеева элементов которые в этот сплав добавлены.Вычёркиваем слова "положения в таблице Менделеева" и получаем что-то, отличающееся от неосмысленного бреда.
Кстати, сколько периодических таблиц Вам известно? Почему?
6 years ago
October 29 2005, 09:38:47 UTC 6 years ago
2. как упрощение и ускорение самой процедуры поиска - кучу синонимов и близких по значению слов я объеденяю в свою личную категорию, которую проще вспомнить и указать при поиске, чем вводить сразу кучу вариантов. Не парюсь на каком языке я ищу, просто задал категорию(которую до этого навесил) и получил ресурсы на разных языках.
October 29 2005, 10:32:11 UTC 6 years ago
2. Поиск по содержимому невозможен (актуально для картинок, вебкомиксов, etc).
3. Куски информации откладываются с намерением "прочитать при необходимости" (я ещё не знаю содержания в момент поиска).
4. Массив создаётся с расчётом на других пользователей (категории вводить быстрее, чем аннотации).
Есть ещё какие-то, но сейчас в голову не приходят.
October 29 2005, 11:07:38 UTC 6 years ago
+ метки для записей в блогах, или, там, для ссылок в делишес, они как рефераты для научных статей. Текст док-ва теоремы Ферма может не содержать слова „Ферма“, но реферат этого текста будет содержать его наверняка, что поможет при поиске. Метаинформация, да, вытягивание которой из текста документа автоматическими кластеризаторами это полный rocket science.
← Ctrl← Alt
Ctrl →Alt →