Jump to content
  • 0

помогите обернуть чужие ссылки (не моего домена) nofollow и noindex


Nikol Tesla
 Share

Question

10 answers to this question

Recommended Posts

  • 0

Понятно. Неправильно понял я. Как мне кажется, большинство форумных движков имеют такую встроенную функцию, а если ее нет, то вопрос нужно адресовать в раздел движков. имхо.

Link to comment
Share on other sites

  • 0

Я тоже не мастер регулярок, но вроде работает, вот пример:


$domen = 'site.ru';
$patern = '<a.*href="(http:\/\/(?!www\.'.$domen.'|'.$domen.').*?)".*>.*?<\/a>';
$text = file_get_contents('doc.html');

preg_match_all('/'.$patern.'/', $text, $match);
Echo "<pre>\n".print_r($match[1], true)."\n</pre>";

Link to comment
Share on other sites

  • 0

Понятно. Неправильно понял я. Как мне кажется, большинство форумных движков имеют такую встроенную функцию, а если ее нет, то вопрос нужно адресовать в раздел движков. имхо.

движок написан программистом знакомым, который сейчас загулял... сам то я больше по JS, Delphi кодю.

Link to comment
Share on other sites

  • 0

Я тоже не мастер регулярок, но вроде работает, вот пример:


$domen = 'site.ru';
$patern = '<a.*href="(http:\/\/(?!www\.'.$domen.'|'.$domen.').*?)".*>.*?<\/a>';
$text = file_get_contents('doc.html');

preg_match_all('/'.$patern.'/', $text, $match);
Echo "<pre>\n".print_r($match[1], true)."\n</pre>";

вообще левый код :) Мне только и надо что определить домен в ссылке юзера в его сообщении и если домен не фига не мой, то экранить ссылку

<!--noindex-->Текст или код, закрываемый от индексации Яндекс/Рамблер<!--/noindex-->

а в саму ссылку пихать rel="nofollow"

Link to comment
Share on other sites

  • 0

$data='example: [url=http://kamrbb.ru/1.php]grdfgdfgfdg[/url]';
$data=str_replace('[/url]',"`",$data);

$A='/\[url=([а-яёA-Za-z0-9\.\/_?#&%=;,~:\+\-]*)\]([^`]*)`/i';

while(preg_match($A, $data)){

echo $marr[0][0];

preg_match_all($A, $data, $marr, 2);

$m = $marr[0][1];

if(!preg_match('/kamrbb\.ru/i',$m)){
$B='<!--noindex--><a rel="nofollow" target=_blank href="\\1"><u>\\2</u></a><!--/noindex-->';
}else{
$B='<a target=_blank href="\\1"><u>\\2</u></a>';
}

$m=preg_replace($A,$B,$marr[0][0]);

$data=str_replace($marr[0][0],$m,$data);

}

echo $data;

Сам написал за несколько мучительных часов с учебником PHP.

$text = 'ffef http://www.flashboot.ru/index.php efeffefefef http://forum.htmlbook.ru ddsds http://a.kamrbb.ru ssd';

$A='/( |^|`)(http:\/\/[а-яА-ЯA-Za-z0-9\/_\?\!#\&%\=;,:\+\.\-]*)( |`|$)/';
while(preg_match($A, $text)){
echo $marr[0][0];
preg_match_all($A, $text, $marr, 2);
$m = $marr[0][1];
if(!preg_match('/kamrbb\.ru/i',$m)){
$B='<!--noindex-->\\1<a rel="nofollow" target=_blank href="\\2">\\2</a>\\3<!--/noindex-->';
}else{
$B='\\1<a target="_blank" href="\\2">\\2</a>\\3';
}
$m=preg_replace($A,$B,$marr[0][0]);
$text=str_replace($marr[0][0],$m,$text);
}

echo $text;

где то я косякнул((( множит ссылки если есть вложения картинок...

Edited by Nikol Tesla
Link to comment
Share on other sites

  • 0


$domen = 'site.ru';
$patern = '<a.*href="(http:\/\/(?!www\.'.$domen.'|'.$domen.').*?)".*>.*?<\/a>';
$text = file_get_contents('doc.html');

preg_match_all('/'.$patern.'/', $text, $match);
Echo "<pre>\n".print_r($match[1], true)."\n</pre>";

вообще левый код :) Мне только и надо что определить домен в ссылке юзера в его сообщении и если домен не фига не мой, то экранить ссылку

<!--noindex-->Текст или код, закрываемый от индексации Яндекс/Рамблер<!--/noindex-->

а в саму ссылку пихать rel="nofollow"

Код не левый, он просто по-видимому не постижим вашей ментальности.

Я поясню: здесь нет готового решения для вас, но так как вы написали что у вас плохо с регулярками я написал её за вас.

Эта регулярка отыскивает все ссылки ссылающиеся на чужие домены, в переменную $domen нужно вписывать свой домен без префикса www

С этим массивом можно легко реализовать то что вам надо, стоит только немного подумать, совсем чуть-чуть.

Код привёл как пример, а не как готовое для копипаста решение.

P.S. А вот ваш код действительно - бугагашенька :lol:

Link to comment
Share on other sites

  • 0

Здравствуйте!

Получилось решить задачу?

Ищу готовое решение.

Задача такая же обернуть все внешние ссылки в <noindex> и добавить в ссылку rel='nofollow'.

Также нельзя трогать ссылки без http или https, т.к. часто внутренние ссылки делал сокращенно. А так же есть и якоря внутри страниц. И сайт был сначала http, а теперь https.

Т.к. не знаю что делать с регулярками, по другому подходил к решению этой задачи, но вижу в ней много недостатков. Вот краткий алгоритм в тексте, который я набросал. Хотел использовать автозамену.

1. Найти тег </a>.
2. Сохраняем в переменную кусок текста с закрывающим тегом </a>, а оставшийся текст в другую переменную.
3. Проверить на http (если нет, ищем тег в оставшийся части текста)
4. Если есть http проверить на наличие site после <a. Если нет к п.1.
5. Если нет site,  сделать автозамену  "<a" на "<noindex><a rel='nofollow' " и </a> на "</a></noindex>".
6. Переходим к п. 1.

 

Link to comment
Share on other sites

  • 0

Помогите пожалуйста доработать регулярное выражение. Что бы автозамена не трогала также ссылки где нет http(s) в начале.

<?php
$text = 'ffef <a href="https://www.flashboot.ru/index.php">ссылка 1 с заменой</a> 
<a href="http://forum.htmlbook.ru">ссылка 2 с заменой</a> текст текст 
<a href="http://moysite.ru/bbb/aaa/ggg.html">моя ссылка без замены</a> kf kf kf<br />
текст <a href="/index.php">внутренняя ссылка</a><br />
<a href="#p1">ссылка на якорь</a>';

$regex = '%(<a\shref="(?!https?://moysite\.ru))(.*?</a>)%i';
$replacement = '<noindex><a rel="nofollow" href="$2</noindex>';
$result = preg_replace($regex, $replacement, $text);
echo $result;
?>

 

Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Answer this question...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

 Share

×
×
  • Create New...

Important Information

We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue. See more about our Guidelines and Privacy Policy