title
Description
Body
Граб основан на том он как браузер получает код обрабатывает и отображает.
|
|
Добавлено спустя 2 минуты 8 секунд:
Проблема нет стилей и не отображаются картинки так?
Добавлено спустя 6 минут 12 секунд:
это п тому что там такой html код его можно увидеть вункцией highlight_string
|
|
Отредактировано TLENS (2011.05.11 22:41)
Неактивен
Дале надо заменить адреса картинок
заменять будем функцией str_replace('Что заменить','На что заменить','Из чего заменить т.е. текст (наш html код)');
|
|
Попробуй появлятся картинки?
Отредактировано TLENS (2011.05.11 22:41)
Неактивен
Ну понял почему картинки начали отображатся?
Там в мы получили такой код картинок
<img width="55" height="55" alt="Ясно" src="/static/images/icons/new/n.moon.png" />
когда мы заменили src="/ на src="http://m.gismeteo.ua/
И у нас получилось html
<img width="55" height="55" alt="Ясно" src="http://m.gismeteo.ua/static/images/icons/new/n.moon.png" />
Отредактировано TLENS (2011.05.11 22:24)
Неактивен
TLENS, загружает браузер CSS, прочтя это(допустим) <link rel="stylesheet" href="/style.css" type="text/css"/>. Как было выше сказано, poisen, нужно изменить путь, нужно указать браузеру тот CSS, который есть. Меняем:
|
|
Отредактировано DarkRiDDeR (2011.05.12 12:47)
Неактивен
Кажись я не в темку попал, извенясь, .
Ладн, моя задач:
обрезать всё до тега <body> включительно. Ведь зачем нам чужие заголовки и мета-теги, и т.п.? Ну и напоследок тег </bodу> нейтрализовать. Не будет же он болтаться на морде, как кусок ненужной кожи.
Неактивен
А хотя и сейчас познакомимся с ними.
вообщем даю кусочек кода он будет у тебя шаблоном пожже будешь писать боле быстрые регулярки.
например нам надо вырезать неизвесный текст
мы берем текст начало и конец извесного.
вырезать заголовки html начиная с <head> и заканчивая </head>
будешь использовать preg_replace
|
|
где .*? это неизвесный текст
Наверное заметил я поставил обратный слеш \ перед слешем
Это для того чтобы заэкранировать спец символ /
спец символы это те символы которые использует выражения
их много приведу популярные \^ $ . [ ] | ( ) ? * + { } / ^
их надо экранировать в нашем случае.
например если нам надо вырезать ссылку с неизвесным текстом тот что меняется скриптом
допустим <a href="http://wapinet.ru/ne_izvesnuy_text">ne_izvesnuy_text</a>
чтобы вырезать такую ссылку надо применить preg_replace('/<a href="http:\/\/wapinet\.ru\/.*?">.*?<\/a>/s','',$f);
Добавлено спустя 4 минуты 8 секунд:
Gemorroj написал:
Код:
1
span style="color: #0000BB"><?php$xml = new SimpleXMLElement('http://wapinet.ru/', null, true);echo $xml->body[0]->asXML();
Ну можно и так хотя я ниразу так не делал.
Я воще последнее время все по масивам расбиваю и выводится как свой а вообще если чесно то все по базам пару последних скриптов
Неактивен
TLENS, можно вырезать и без регулярок, что я выше написал. Подсказка: массивы
Неактивен
Есть <a href="http://wapinet.ru/ne_izvesnuy_text">ne_izvesnuy_text</a>
Вырезаем (если правильно понял):
|
|
Можно вырезать и по другому, много способом. Ну пока ладно. Короче, что в скобках, сравни с предыдущим примером, как бы сохраняется в переменных по очереди. $1 - <a href=", $2 - .*?">.*?<\/a>. $0 - это всё сохранённое, а именно: <a href=".*?">.*?<\/a>
Неактивен
http://fank.ru/foto/category/s/13/
вот что выходит
http://xmxx.ru/video2/video4/
выризал что смог
как правельно исправить чтобы перети к фото и вырезать альбомы
$inf = str_replace('<a href="/foto/data/s/">[v]</a>','<a href="http://fank.ru/foto/s/">Смотреть</a>',$inf);
$inf = str_replace('/<a href="http:\/\/fank\.ru\/foto\/album\/u\/.*?">.*?<\/a>/s','',$inf);
а в целом вот
|
|
Отредактировано poisen (2011.05.29 08:40)
Неактивен
<!--LiveInternet logo--><a href="http://www.liveinternet.ru/ click" 43. target="_blank"><img src="// counter.yadro.ru/logo?26.10" 44. title="LiveInternet: показано число посетителей за сегодня" 45. alt="" border="0" width="88" height="15"/></a><!--/ LiveInternet--> как ето вирежат в грабере?
Неактивен
DarkRiDDeR написал:
Кажись я не в темку попал, извенясь, .
Ладн, моя задач:
обрезать всё до тега <body> включительно. Ведь зачем нам чужие заголовки и мета-теги, и т.п.? Ну и напоследок тег </bodу> нейтрализовать. Не будет же он болтаться на морде, как кусок ненужной кожи.
|
|
Swinger написал:
preg_match('#<body>(.*?)</body>#si', file_get_contents('http://wapinet.ru/'), $body);
echo $body[1]; // выведет все, что находится между тегами body
и ненад вырезать всякие тэги
True вариант
Надо еще Геморроя вариант посмотреть, как он работает.
Отредактировано tipsun (2011.10.29 17:31)
Неактивен
POFIGISST, или сам определи или функцией.
И конвертируй mb_convert_encoding()
Отредактировано tipsun (2011.10.29 18:17)
Неактивен
tipsun написал:
POFIGISST, или сам определи или функцией.
И конвертируй mb_convert_encoding()
спасибо,разобрался,теперь нормик текст выводит))
Неактивен
мое Г
|
|
на денвере делал,поэтому копирайт Test12.Ru ))
Неактивен
N1ck написал:
<!--LiveInternet logo--><a href="http://www.liveinternet.ru/ click" 43. target="_blank"><img src="// counter.yadro.ru/logo?26.10" 44. title="LiveInternet: показано число посетителей за сегодня" 45. alt="" border="0" width="88" height="15"/></a><!--/ LiveInternet--> как ето вирежат в грабере?
помогите плиз
Неактивен
N1ck
как то так это будет $f = preg_replace('/<!--LiveInternet logo-->(.*?)<!--/ LiveInternet-->/s','',$f);
З.Ы. возможно ошибка в вырезке,не проверял)
Отредактировано POFIGISST (2012.01.27 16:43)
Неактивен
Хочу написать грабб чартов отсюда но пока не совсем выходит,а вернее совсем не выходит
вот такой код у меня сейчас идет
|
|
вырезаю все лишнее(счетчики,реклама,и т.д.), делаю замену дивов на свои,графика идет с моего сайта( http://xporno.in/tophit/ ) ,но вот с навигацией у меня выходят проблемы,не работает она,и ссылки на чарты тоже нихера не работают,как это исправить? и какие замечания по коду есть?
Неактивен
Gemorroj написал:
по коду - не так.
там валидный xml. ты можешь парсить данные с помощью simplexml легко и не принужденно.
Благодарю Паш,протрезвею почитаю инфу как делать через simplexml,не разу так не делал(( но обязательно сделаю
Неактивен
Здравствуйте, пишу граб поиска, все нормально работает, но когда подключаю шапку то скрины не показывает, попробывал разные шапки но всеровно бестольку.
Скажите пожалуйста, в чем проблема и как его решить?
Вот индексный файл:
|
|
Неактивен
Например вот:
|
|
Неактивен
Karayazi, если я не ошибаюсь, то банально надо просто подставить исходный адрес изображения
|
|
Отредактировано tipsun (2012.03.05 13:12)
Неактивен
Через файл можно.
http://mysite.ru/image.php?img=address
|
|
Неактивен