Jump to content

Kirk

Newbie
  • Posts

    9
  • Joined

  • Last visited

Everything posted by Kirk

  1. Kirk

    Ссылки

    Николай, да я что только уже не сделал, с помощью многочисленных операций я кое как разгрёб это дело и добился нужного результата. Спасибо Вам и Vano1208 за то что оказались неравнодушны по отношению ко мне!
  2. Kirk

    Ссылки

    Николай, в смысле с фантазией подхожу, сарказм? Размер текстового файла больше гигабайта. Вот в notepad++ как раз работает кое как, но всё равно лагает, другие редакторы сразу входят в ступор. Я PHP не очень хорошо знаю и по этому с simplexml, DOM и phpQery я думаю долго буду разбираться, в любом случаи Вам спасибо за то что уделили мне время! Просьба с регулярным выражением всё ещё актуальна, нужно на PHP. В очередной раз спасибо за внимание!
  3. Kirk

    Ссылки

    Жесть, скрипт то рабочий, только вот документ получился на 3 миллиона строк из-за того что туда попали и просто пути с одними слэшами и такое дело править очень трудно - очень долго приходится ждать времени после определённой операции, пока отлагает. В общем, я думаю что мой редактор пока я буду спать сам себе деинсталирует когда-нибудь. Может кто помочь с регулярным выражением? Чтобы брались только ссылки которые начинаются на http и заканчиваются на html. Спасибо за внимание!
  4. Kirk

    Ссылки

    Да да, я вот уже нашёл нужный скрипт который отлично работает, может кому понадобится... Прошу прощение за беспокойство! <?php /* $html - некий html-код некой страницы, \n - это переход на новую строку (верстальщики иногда это делают) */ $html = "Текст <a href='page1.html'>ссылка</a> и снова <a hREF \n =\"page2.html\" title=''>ссылка</a> конец"; /* Вызываем функцию, которая все совпадения помещает в массив $matches */ preg_match_all("/<[Aa][\s]{1}[^>]*[Hh][Rr][Ee][Ff][^=]*=[ '\"\s]*([^ \"'>\s#]+)[^>]*>/", $html, $matches); $urls = $matches[1]; // Берём то место, где сама ссылка (благодаря группирующим скобкам в регулярном выражении) /* Выводим все ссылки */ for ($i = 0; $i < count($urls); $i++) echo $urls[$i]."<br />";?>
  5. Kirk

    Ссылки

    Добрый день! Ребята, перепробовав множество вариантов и не добившись нужного результата я просто вынужден снова обратиться сюда, к Вам за советом... Есть документ, он очень большой и нужно из него удалить всё кроме ссылок которые начинаются с http. Перепробовал много расширений для браузера которые копируют все ссылки из исходного кода в буфер, но там на столько много информации что когда я вставляю то вставляется undefined, а если документ в разумном размере то они отлично все работают. Нужно либо удалить всё и оставить только ссылки или как-то скопировать все ссылки в буфер. Спасибо за внимание!
  6. Kirk

    PHP (file)

    Всем выше отписавшимся я бесконечно благодарен!
  7. Kirk

    PHP (file)

    Спасибо, буду разбираться!
  8. Kirk

    PHP (file)

    Пояснение... Пытаюсь прочитать страницу таким образом: <?phpheader("content-type: text/plain");$massiv = file("ссылка на страницу с фильмом");echo "<pre>";print_r($massiv);echo "</pre>";?>и вместо страницы с фильмом читается страница с защитой где говорится о том что я робот, как правильно написать скрипт? Спасибо за внимание!
  9. Kirk

    PHP (file)

    Добрый вечер ребята, пожалуйста подскажите как обойти одну вещь... Пытаюсь с помощью функции file прочитать в массив страницу с фильмом на Кинопоиске но вместо этого там читается страница где говорят что сейчас работает программа а не человек, как обойти? Не знаю как самостоятельно послать все необходимые заголовки, на некоторых сайтах помогает использование только этого header("content-type: text/plain"); Спасибо за внимание!
×
×
  • Create New...

Important Information

We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue. See more about our Guidelines and Privacy Policy