Кукуц Шмукуц ([info]kukutz) wrote,
@ 2005-11-16 14:12:00
Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Маленькие секреты поиска по блогам: операторы
Как искать ссылки на себя/какой-то сайт?

Запрос [link="ссылка без http, в конце может быть звёздочка"]

Пример: link="www.livejournal.com/users/kukutz*"
Улучшенный пример: link="www.livejournal.com/users/kukutz*" | link="livejournal.com/users/kukutz*" | link="www.livejournal.com/~kukutz*"
Пример: link="www.ya.ru*"
Улучшенный пример: link="www.ya.ru*" | link="ya.ru*"

Как искать все записи в чьём-то ЖЖ?

Запрос [author="ник"]

Пример: author="kukutz"

Как искать записи только на каком-то сервере?

Запрос [server="имя сервера без http"]

Пример: server="lj.rossia.org"

Как искать по категориям (тагам)?

Запрос [category=(запрос)]

Пример: category=(webdev)
Улучшенный пример: category=(webdev | web-dev)

Как искать по музыке/настроению?

Запросы [music=(запрос)] и [mood=(запрос)]

Пример: music=(nautilus | наутилус)
Пример: mood=(секс)

Как ограничить область поиска?

То есть, как соединить любой из предыдущих операторов с другим запросом? Использовать оператор [<<].

Скажем, все мои записи про Mozilla: mozilla << author="kukutz"
Все записи с настроением, содержащим слово "секс", с сервера lj.rossia.org: mood=(секс) << server="lj.rossia.org"



(Post a new comment)


[info]_zerg
2005-11-16 11:21 am UTC (link)
Спасибо :)

(Reply to this)


[info]zmey2
2005-11-16 11:25 am UTC (link)
клёво бы вынести это в памятку на морду blogs.yandex.ru
в основном про линки

(Reply to this) (Thread)


[info]kukutz
2005-11-16 11:27 am UTC (link)
В помощь точно вынесу, а про морду подумаю.

(Reply to this) (Parent)


[info]linker
2005-11-16 11:44 am UTC (link)
в [info]textbook_lj ?

(Reply to this) (Thread)


[info]kukutz
2005-11-16 02:03 pm UTC (link)
А что это?

(Reply to this) (Parent)(Thread)

(no subject) - [info]linker, 2005-11-16 02:08 pm UTC

[info]yakovis
2005-11-16 12:25 pm UTC (link)
А как найти посты определенного автора в определенном комьюнити?

(Reply to this) (Thread)


[info]kukutz
2005-11-16 02:01 pm UTC (link)
Никак, к сожалению, этой информации просто нет в RSS, транслируемом ЖЖ.

(Reply to this) (Parent)


[info]begemot
2005-11-16 12:42 pm UTC (link)
А как искать только по блогам (но не только жж) и исключить из выдачи совершенно ненужные в большинстве своем результаты из форумов и новостных сайтов (они то, они то нахрен в поиске по блогам?!?)

Пока приходится довольствоваться неуклюжей конструкцией ~~server="forum*" (как исключить новостные сайты я так и не смог придумать)

Просто до тех пор, пока не будет явного инструмента разделения поиска по блогам и форумам, блогз.яндекс останется (лично для меня) исключительно инструментом поиска по жж.

(Reply to this) (Thread)


[info]kukutz
2005-11-16 02:06 pm UTC (link)
Новостные сайты исключаются вообще по мере их обнаружения - можете мне жаловаться =)

Форумы от блогов машина отличить умеет с трудом, но мы надеемся что-то сделать в этом отношении.

(Reply to this) (Parent)


[info]sillysunnybear
2006-10-01 07:53 am UTC (link)
там же можно категорию задавать "блоги", "форумы" и "все остальное", но вот как отдельные слова исключить -- этого не нашел

(Reply to this) (Parent)(Thread)

(no subject) - [info]kukutz, 2006-10-01 08:54 am UTC
пояснить для чайников
[info]yurkennis
2005-11-16 12:59 pm UTC (link)
Я бы ещё оговорился, что квадратные скобки ([ и ] не нужно набирать в запросе.

(Reply to this) (Thread)

Re: пояснить для чайников
[info]kukutz
2005-11-16 02:04 pm UTC (link)
Убрал лишние скобки из поста.

(Reply to this) (Parent)


[info]exper
2005-11-16 01:32 pm UTC (link)
Всетаки в случае "Как искать ссылки на себя", добавить таки в конце слэш. иначе я нарвался на огромную кучу "экспертов" :) А еще лучше выкинуть из поиска посты автора :)
Вот, например, ссылки на меня

(Reply to this) (Thread)


[info]exper
2005-11-16 01:35 pm UTC (link)
поправочка. если оставить слэш - не ищет ссылки прямо на журнал. "*" подразумевает "хоть, что-то"? может лучше сделать "хоть, что-то или вообще ничего"?

(Reply to this) (Parent)(Thread)

(no subject) - [info]kukutz, 2005-11-16 02:04 pm UTC

[info]liveuser
2005-11-16 03:23 pm UTC (link)
А зачем так принципально нужен [<<], если author="kukutz" mozilla дает аналогичный результат? Равно как и mood=(секс) server="lj.rossia.org".

(Reply to this) (Thread)


[info]kukutz
2005-11-16 03:31 pm UTC (link)
Ну, во-первых, [mozilla author="kukutz"] вообще не работает =)

Во-вторых, я пытался пояснит там: http://www.livejournal.com/users/urbansheep/1488768.html?thread=5418880&style=mine#t5418880

(Reply to this) (Parent)(Thread)

(no subject) - [info]liveuser, 2005-11-16 04:28 pm UTC
Вот так работает - [info]druxa_druxa, 2005-12-05 01:27 pm UTC
Re: Вот так работает - [info]kukutz, 2005-12-05 01:48 pm UTC

[info]minaton
2005-11-16 06:00 pm UTC (link)
спасибо!

(Reply to this)


[info]illyn
2005-11-17 04:06 am UTC (link)
в конце может быть звёздочка
А в начале — может быть звёздочка? Вместо www допустим.

(Reply to this) (Thread)


[info]illyn
2005-11-17 04:11 am UTC (link)
Проверил - нет, этого делать не стоит.

(Reply to this) (Parent)


[info]vvyy
2005-12-06 10:20 am UTC (link)
А как там насчёт поиска в комментах? Он будет?

(Reply to this) (Thread)


[info]kukutz
2005-12-06 12:39 pm UTC (link)
Если ЖЖ сделает выдачу комментариев в RSS - то будет, если не сделает - то не будет.

(Reply to this) (Parent)(Thread)

(no subject) - [info]mcmartyn, 2006-01-31 04:10 pm UTC
(no subject) - [info]kukutz, 2006-01-31 05:00 pm UTC
(no subject) - [info]mcmartyn, 2006-01-31 08:58 pm UTC
(no subject) - [info]kukutz, 2006-01-31 10:00 pm UTC
(no subject) - [info]mcmartyn, 2006-01-31 10:05 pm UTC
(no subject) - [info]kukutz, 2006-01-31 10:07 pm UTC
(no subject) - [info]mcmartyn, 2006-01-31 10:12 pm UTC

[info]skuzn
2005-12-09 11:41 pm UTC (link)
а где же поиск по подзамочным записям, который ты обещал где-то у меня в комментах?

(Reply to this) (Thread)


[info]kukutz
2005-12-10 12:04 am UTC (link)
Сюда я дал ссылку про поиск по категориям.

А про подзамочные записи я говорил не про поиск, а про добавление их в Яндекс.Ленту.

Просто берёшь и добавляешь http://USER:PASSWORD@www.livejournal.com/users/YOURFRIEND/data/rss?auth=digest

(Reply to this) (Parent)(Thread)

(no subject) - [info]skuzn, 2005-12-10 12:11 am UTC
(no subject) - [info]kukutz, 2005-12-10 12:17 am UTC
(no subject) - [info]skuzn, 2005-12-10 07:42 pm UTC
(no subject) - [info]kukutz, 2005-12-10 07:52 pm UTC
вопросы
[info]lepin
2005-12-10 07:14 am UTC (link)
1. Я правильно понял, что синонимичность www.livejournal=livejournal и ~kukutz=/users/kukutz эта штука понимает на уровне зональных условий server= и author=, а вот для не-блоговых, типа link= - не понимает?
2. Почему для поиска по настроениям и музыке необходимы кавычки? Зачем так сделано, это ведь интуитивно непонятно. Если надо искать несколько слов - ну, пусть будут привычные кавычки в таких случаях.
3. Не вижу ни одно разумного аргумента, почему запрос [mozilla author="kukutz"] ничего не находит. Почему << не подразумевается по умолчанию в случае зональных условий?

(Reply to this) (Thread)

Re: вопросы
[info]kukutz
2005-12-10 06:05 pm UTC (link)
1. Да, правильно.

2. Не кавычки, а скобки Вы имели в виду?
Мне это тоже не нравится, я согласен, что это интуитивно непонятно, но так устроено поисковое ядро Яндекса сейчас, что для полнотекстового поиска внутри аттрибута (в отличие от литерального, как у аттрибутов author/server/link) необходим вот такой синтаксис.
Зато, как видно, можно писать music=(кино|цой|мацой) например.

3. Таких аргументов не существует, потому что [author="kukutz" mozilla] работает. К сожалению, это такая недоработка, которая, я надеюсь, будет исправлена.

(Reply to this) (Parent)(Thread)

да - [info]lepin, 2005-12-10 11:45 pm UTC
Re: да - [info]kukutz, 2005-12-11 12:13 pm UTC
я не это имел в виду - [info]lepin, 2005-12-11 12:48 pm UTC
поправка по первому способу
[info]gagin
2005-12-10 08:04 am UTC (link)
На самом деле, так будут найдены не все ссылки.
Если в жж я вставляю текст
http://www.livejournal.com/users/kukutz/264827.html
то при выдаче он будет ссылкой - и ссылки внутри жж так часто и делаются, просто вставлением урла в текст.
А описанный запрос это ссылками не считает (видимо, потому что в экспорте жж они идут как обычный текст).

(Reply to this) (Thread)

Re: поправка по первому способу
[info]kukutz
2005-12-10 06:06 pm UTC (link)
Вот за это большое спасибо.

Это, кажется, нужно исправлять и переиндексировать всё заново.

Вот и работа нашлась =)

(Reply to this) (Parent)

Re: поправка по первому способу - [info]kukutz, 2005-12-10 06:08 pm UTC
да, вру - [info]gagin, 2005-12-10 11:42 pm UTC

[info]_1313
2006-01-06 03:17 pm UTC (link)
уважаемый [info]kukutz, у меня проблемка с blogs.Яндекс, я подумал, что вы мне, возможно, сможете подсказать её решение

у меня правильно ник пишется как #1313. в жж-никах, естественно, символ решётки недопустим, поэтому при регистрации я взял себе такой вот, с подчерком спереди. регулярно ищу в чужих журналах ссылки на себя, но из-за специфического ника постоянно встречаю левые посты, авторы которых описывают события 1313 года или, например, ссылаются на какую-нибудь страницу http://www.domain.com/article.php?id=1313, что мне, естественно, не нужно. я пытался экспериментировать со слэшами, с кавычками, но нужного результата не добился. не подскажете, как мне заставить b.Яндекс искать по строке "_1313", не отбрасывая символ подчёркивания?

зы. поиск по строке "#1313" вообще ничего не возвращает почему-то...

(Reply to this) (Thread)


[info]kukutz
2006-01-06 03:26 pm UTC (link)
В посте про это написано =)

http://blogs.yandex.ru/search.xml?how=tm&rd=2&text=link%3D%22www.livejournal.com%2Fusers%2F_1313*%22

(Reply to this) (Parent)(Thread)

(no subject) - [info]_1313, 2006-01-06 03:32 pm UTC
(no subject) - [info]kukutz, 2006-01-06 03:35 pm UTC
(no subject) - [info]_1313, 2006-01-06 03:42 pm UTC
(no subject) - [info]kukutz, 2006-01-06 03:45 pm UTC
Может я чего не понимаю
[info]alexfg
2006-02-02 09:58 pm UTC (link)
Может я чего не понимаю, но вопрос такой:
Как найти все записи юзера "X" в сообщесте "Y" ?
Скотлько не бьюсь не могу найти ответа.

(Reply to this) (Thread)

Re: Может я чего не понимаю
[info]kukutz
2006-02-03 12:33 pm UTC (link)
К сожалению, эта информация недоступна в RSS, так что никак.

(Reply to this) (Parent)

(Reply from suspended user)

Create an Account
Forgot your login or password?
Login w/ OpenID
English • Español • Deutsch • Русский…