VETYSHEV.RU » Google
Июн
26

Конвертируем doc, xls, ppt, rtf, pdf в HTML бесплатно

В этой статье хочу рассказать, как совершенно бесплатно и к тому же быстро, конвертировать документы Microsoft Office, Open Office, PDF в HTML не устанавливая программ, типа PDF2HTML или Adobe Acrobat. Эта методика уже заезжана, и вы наверное уже слышали о ней. Но для тех кто не слышал, пишу эту статью.

Это работает на любой платформе, и самое главное – бесплатно. Применим анонсированную Google методику быстрого просмотра почтовых вложений в их почтовом сервисе GMail:

Заводим себе ящик на GMail.com. Tеперь это возможно каждому совершенно бесплатно и приглашение теперь не нужно.
Создаем новое письмо в веб-интерфейсе GMail.
Прикрепляем к письму нужный PDF или Word документ, который Bы хотите конвертировать в HTML. Bы можете сразу конвертировать несколько файлов, по очереди приложив их к письму.
B поле Kому: впишите собственный email адрес и отправляйте письмо.
Письмо тут же появится в вашей папке Bходящие. Oткройте это сообщение и нажмите на ссылку "Просмотр в виде HTML" ("View as HTML") напротив необходимого вложения.
Cодержимое файла повидится в виде HTML в новом окне браузера. Bы можете сохранить его на жесткий диск через меню браузера "Cохранить как".

B данный момент GMail может это делать со следующими типами файлов: .pdf, .doc, .xls, .ppt, .rtf, .sxw, .sxc, .sxi, .sdw, .sdc, .sdd, and .wml.

У Вас есть возможность расширить данные способности, и к примеру переводить PDF в DOC таким образом. Cохранив PDF в HTML как описано выше, а затем открыть данный PDF программой Microsoft Word и сохранив его как .doc файл.

Однако хочу добавить, если же PDF-файл запаролен, то этот способ не "прокатит".

мая
24

PHP-скрипт массового определения PR у доменов

Категория PHP | 6 комментариев

Хочу поделится рабочим кодом для массового определения PageRank у доменов. Хочу также отметить, что данный скрипт не работает на некоторых хостингах, но у меня на локалке работает отлично!

<form action="" method="POST">
Адреса сайтов(в каждую строку по 1-му домену): <Br>
<textarea name="domains" cols="40" rows="5"></textarea><br>
<input type="submit" name="button1" value="Определять"></td></tr></table>
</form>

<?

define('GOOGLE_MAGIC', 0xE6359A60);

//unsigned shift right
function zeroFill($a, $b)
{
$z = hexdec(80000000);
if ($z & $a)
{
$a = ($a>>1);
$a &= (~$z);
$a |= 0x40000000;
$a = ($a>>($b-1));
}
else
{
$a = ($a>>$b);
}
return $a;
}

function mix($a,$b,$c) {
$a -= $b; $a -= $c; $a ^= (zeroFill($c,13));
$b -= $c; $b -= $a; $b ^= ($a<<8);
$c -= $a; $c -= $b; $c ^= (zeroFill($b,13));
$a -= $b; $a -= $c; $a ^= (zeroFill($c,12));
$b -= $c; $b -= $a; $b ^= ($a<<16);
$c -= $a; $c -= $b; $c ^= (zeroFill($b,5));
$a -= $b; $a -= $c; $a ^= (zeroFill($c,3));
$b -= $c; $b -= $a; $b ^= ($a<<10);
$c -= $a; $c -= $b; $c ^= (zeroFill($b,15));

return array($a,$b,$c);
}

function GoogleCH($url, $length=null, $init=GOOGLE_MAGIC) {
if(is_null($length)) {
$length = sizeof($url);
}
$a = $b = 0x9E3779B9;
$c = $init;
$k = 0;
$len = $length;
while($len >= 12) {
$a += ($url[$k+0] +($url[$k+1]<<8) +($url[$k+2]<<16) +($url[$k+3]<<24));
$b += ($url[$k+4] +($url[$k+5]<<8) +($url[$k+6]<<16) +($url[$k+7]<<24));
$c += ($url[$k+8] +($url[$k+9]<<8) +($url[$k+10]<<16)+($url[$k+11]<<24));
$mix = mix($a,$b,$c);
$a = $mix[0]; $b = $mix[1]; $c = $mix[2];
$k += 12;
$len -= 12;
}

$c += $length;
switch($len) /* all the case statements fall through */
{
case 11: $c+=($url[$k+10]<<24);
case 10: $c+=($url[$k+9]<<16);
case 9 : $c+=($url[$k+8]<<8);
/* the first byte of c is reserved for the length */
case 8 : $b+=($url[$k+7]<<24);
case 7 : $b+=($url[$k+6]<<16);
case 6 : $b+=($url[$k+5]<<8);
case 5 : $b+=($url[$k+4]);
case 4 : $a+=($url[$k+3]<<24);
case 3 : $a+=($url[$k+2]<<16);
case 2 : $a+=($url[$k+1]<<8);
case 1 : $a+=($url[$k+0]);
/* case 0: nothing left to add */
}
$mix = mix($a,$b,$c);
/*-------------------------------------------- report the result */
return $mix[2];
}

//converts a string into an array of integers containing the numeric value of the char
function strord($string) {
for($i=0;$i<strlen($string);$i++) {
$result[$i] = ord($string{$i});
}
return $result;
}

function get_pr($url) {
$result=array("",-1);

if (($url.""!="")&&($url.""!="http://")):
// check for protocol
if (substr(strtolower($url),0,7)!="http://"):
$url="http://".$url;
endif;

$url="info:".$url;
$checksum=GoogleCH(strord($url));
$google_url=sprintf("http://www.google.com/search?client=navclient-auto&ch=6%u&features=Rank&q=".$url,$checksum); // url to get from google

$contents="";

$handle = fopen($google_url, "rb");
$contents = '';
while (!feof($handle)) {
$contents.= fread($handle, 8192);
}
fclose($handle);
$p=explode(":",$contents);
if (isset($p[2])):
$result[1]=$p[2];
endif;
endif;

return $result;
}

function getPR_url($url)
{
global $db;

if (eregi('^http://www.',$url)) {
$url_www = str_replace('http://www.','http://',$url);
} else {
$url_www = str_replace('http://','http://www.',$url);
}

$pr=get_pr($url);
$output=$pr[0];
$pagerank=$pr[1];
sleep(1);
$pr=get_pr($url_www);
$output_www=$pr[0];
$pagerank_www=$pr[1];

if ($pagerank<$pagerank_www) {
$pagerank=$pagerank_www;
}
if ($pagerank==-1) {
$pagerank=0;
}
return intval($pagerank);
}

$alldom=explode("\r\n",$_POST['domains']);
foreach($alldom as $v){
$v=trim($v);
$page_show = getPR_url($v);
$inlude = ($v);
if($page_show>0);
echo "<a href='$inlude' target='blank'>$inlude</a> - PageRank ресурса = <font color='green'><strong>$page_show</strong></font>";
echo "</br>";
}
?>

Апр
21

Google выследит педофилов!

Специалисты Google разработали новую программу, которая позволяет выявлять пользователей, часто посещающих сайты с детской порнографией, а также обнаруживает появление в сети новых изображений порнографического содержания.

Данную разработку инвестировал центр по исчезновению и эксплуатации детей США (NCMEC).
В том же контексте была усовершенствована программа, предназначавшаяся для борьбы с нарушителями авторских прав на видеопортале YouTube, который является собственностью Google.

Шаблонное распознавание – система, которая лежит в основе программы, даёт реальную возможность выслеживать и идентифицировать файлы, которые содержат сцены сексуального домогательства в отношении детей.

Компания Google поясняет, что совместные проекты с NCMEC преследуют цель создания такого
программного обеспечения, которое искоренит из сети пользователей, использующих Internet, как средство наживы путём растления малолетних.

Специалист компании Google, Ш. Балуя, сетует на то, что с расширением глобальной сети и с появлением на её пространстве большего количества любителей детской порнографии, работники не справляются с огромным потоком информации.

Начиная с 2002 года, NCMEC отфильтровал свыше 13 миллионов файлов, содержанием которых являлось домогательство в отношении детей и сцены насилия. И с каждым годом такой информации в сети становится всё больше и больше.

По мнению Google, созданная ими программа поможет более эффективно пресекать публикацию файлов подобного характера.

“Программа способна распознавать не только определённые заданные ей шаблоны, но и те, которые умышленно подвергались видоизменениям”- поясняет эксперт Google. В таком случае если программа “видит разницу” между простым портретом и пейзажем местности, то ей будет по силам найти изображение эксплуатируемого ребёнка и обнаружить преступника.

Мар
17

Бан в Google

В этом посте я постараюсь рассказать, как попасть в бан в Гугле. Если однажды утром вы проснетесь и увидите что ваш сайт выпал из индекса Гугл, есть вероятность, что вы были забанены. Возможно это и какой-то глюк, но все же стоит убедиться, дабы все сомнения исчезли. Введите адрес вашего сайта в строке поиска в Гугле. Если адреса вашего сайта в результатах поиска не будет, то возможно это бан. Хотя еще раз напомню – это может быть просто очередным глюком.

Еще один способ проверить это – скачать гугловский тулбар. Устанавливаете, вводите адрес сайта. Если вместо PR видите серый бар, то на этот раз вероятнее всего, что сайт действительно попал в бан.

Болезнь легче предотвратить, нежели потом лечить. Таким образом, я расскажу, за что можно получить бан в Гугле.

1) Скрытый текст. Если на сайте цвет текста такой же, как и фон страницы – это может вылиться вам в бан.

2) Спам в тэге Alt в изображениях. Если в тэге Alt будет много повторяющихся слов – будет вам бан.
Пример: “графический дизайн, графический дизайн, графический дизайн, графический дизайн, графические программы, графика” и т.п.

3) Повторы слов в Мета-тэгах. Если в Мета-тэгах будет много повторяющихся слов – получите бан.
Пример: “дизайн, дизайн, дизайн, дизайн, дизайн, дизайн, лучший дизайн, дизайн, отличный дизайн, дизайн”

4) Неправильное заполнение тэга Title. За чрезмерно огромное количество слов (а тем более повторяющихся слов!) в тэге Title – можете получить бан. Из-за этой ошибки, многие сайты более не в индексе Гугла. Писать в Титле более 20 слов лучше не стоит.