-
Posts
9 -
Joined
-
Last visited
Information
-
Sex
Не определился
Kirk's Achievements
Explorer (1/14)
0
Reputation
-
Николай, да я что только уже не сделал, с помощью многочисленных операций я кое как разгрёб это дело и добился нужного результата. Спасибо Вам и Vano1208 за то что оказались неравнодушны по отношению ко мне!
-
Николай, в смысле с фантазией подхожу, сарказм? Размер текстового файла больше гигабайта. Вот в notepad++ как раз работает кое как, но всё равно лагает, другие редакторы сразу входят в ступор. Я PHP не очень хорошо знаю и по этому с simplexml, DOM и phpQery я думаю долго буду разбираться, в любом случаи Вам спасибо за то что уделили мне время! Просьба с регулярным выражением всё ещё актуальна, нужно на PHP. В очередной раз спасибо за внимание!
-
Жесть, скрипт то рабочий, только вот документ получился на 3 миллиона строк из-за того что туда попали и просто пути с одними слэшами и такое дело править очень трудно - очень долго приходится ждать времени после определённой операции, пока отлагает. В общем, я думаю что мой редактор пока я буду спать сам себе деинсталирует когда-нибудь. Может кто помочь с регулярным выражением? Чтобы брались только ссылки которые начинаются на http и заканчиваются на html. Спасибо за внимание!
-
Да да, я вот уже нашёл нужный скрипт который отлично работает, может кому понадобится... Прошу прощение за беспокойство! <?php /* $html - некий html-код некой страницы, \n - это переход на новую строку (верстальщики иногда это делают) */ $html = "Текст <a href='page1.html'>ссылка</a> и снова <a hREF \n =\"page2.html\" title=''>ссылка</a> конец"; /* Вызываем функцию, которая все совпадения помещает в массив $matches */ preg_match_all("/<[Aa][\s]{1}[^>]*[Hh][Rr][Ee][Ff][^=]*=[ '\"\s]*([^ \"'>\s#]+)[^>]*>/", $html, $matches); $urls = $matches[1]; // Берём то место, где сама ссылка (благодаря группирующим скобкам в регулярном выражении) /* Выводим все ссылки */ for ($i = 0; $i < count($urls); $i++) echo $urls[$i]."<br />";?>
-
Добрый день! Ребята, перепробовав множество вариантов и не добившись нужного результата я просто вынужден снова обратиться сюда, к Вам за советом... Есть документ, он очень большой и нужно из него удалить всё кроме ссылок которые начинаются с http. Перепробовал много расширений для браузера которые копируют все ссылки из исходного кода в буфер, но там на столько много информации что когда я вставляю то вставляется undefined, а если документ в разумном размере то они отлично все работают. Нужно либо удалить всё и оставить только ссылки или как-то скопировать все ссылки в буфер. Спасибо за внимание!
-
Всем выше отписавшимся я бесконечно благодарен!
-
Спасибо, буду разбираться!
-
Пояснение... Пытаюсь прочитать страницу таким образом: <?phpheader("content-type: text/plain");$massiv = file("ссылка на страницу с фильмом");echo "<pre>";print_r($massiv);echo "</pre>";?>и вместо страницы с фильмом читается страница с защитой где говорится о том что я робот, как правильно написать скрипт? Спасибо за внимание!
-
Добрый вечер ребята, пожалуйста подскажите как обойти одну вещь... Пытаюсь с помощью функции file прочитать в массив страницу с фильмом на Кинопоиске но вместо этого там читается страница где говорят что сейчас работает программа а не человек, как обойти? Не знаю как самостоятельно послать все необходимые заголовки, на некоторых сайтах помогает использование только этого header("content-type: text/plain"); Спасибо за внимание!