Кой е този сайт ? (и дали е той наистина) Част 1
петък, октомври 9th, 2009Все повече обикновени потребители се сблъскват с измама в Интернет. Става дума не само за опити да ви откраднат номера на кредитната карта, но и за сайтове, които имат претенции да са нещо повече от това, което са в действителност.
Ще покажа няколко метода с които ( с помощта на Jabse разбира се ) можете да съберете допълнителна информация са сайта и да прецените дали заслужава доверие.
Освен стандартния начин на търсене, Jabse поддържа и няколко модификатора, с които можете да намерите информация относно сайта ( вместо информация за текста в него ) . Първият такъв модификатор е info: Форматът е info:www.jabsepropaganda.com а резултатът показва дали търсеното URL е индексирано в Jabse. В случай че да - ще видите извадка от съответната страница + линковете за допълнителна информация. Изберете линка информация и ще видите какво знае Jabse за този сайт :
- Page Rating : означава оценка за важността на страницата, която включва много различни компоненти, като брой и качество на входящите линкове, възраст и други. В момента PR на всички индексирани страници е в границите от 0 до 2.942e-3 ( повече е по-добре ) .
- Top 1 000 000 position -тази информация е налична само за основното URL на всеки домейн и показва позицията на домейна. В случая JabsePropaganda е на 13543-то място
- Добавен: показва кога тази страница е била индексирана за пръв път. Има логика да считате, че по-старите сайтове заслужават по-голямо доверие, но не трябва да разчитате на 100% защото понякога сайтовете сменят собствениците си
- Променен: показва датата на последно индексиране
- Индексирания: общия брой индексирания на страницата - и тук повече е по-добре
- Неуспешни: броя на неуспешни индексирания на страницата - може да се дължи на различни причини, като мрежов проблем, проблем в сървъра и т.н. 0 е идеалното число тук
- Отговор на сървъра: HTTP/1.0 200 OK показва че всичко е било наред при последното минаване на паяк. За подробно обяснение на HTTP STATUS : http://en.wikipedia.org/wiki/List_of_HTTP_status_codes
- Време за зареждане: за колко време паякът е изтеглил страницата . По-малко е по-добре
- Средно време за зареждане: Средна стойност от всички индексирания
- Линкове в документа: брой линкове в индексирания документ
- IP: IP адресът на сървъра, на който е разположен документа.
- всички сайтове на това ip : тук можете да видите какви други сайтове са разположени на този ip адрес. В общия случай 1 домейн е разположен на 1 ip, (разбира се има изключения при големи сайтове, които използват някаква схема на load balancer) и веднага можете да разберете кое е това ip. Обратната операция обаче не е толкова лесна, а тя би могла да ви донесе информация за това какъв тип хостинг използва даден сайт. Например ако някой ви каже че е най-големия интернет магазин, а същевременно на неговото ip има 200 различни домейна - имате основание за съмнения.
- Държава: държавата и града където физически е разположен сървъра. Използва се базата на Maxmind
- Обратен DNS : обратния resolv на ip адреса - използва се например от mail сървъри за защита от спам. Ако правият и обратният resolv съвпаднат - можете да добавите 1 точка към доверието ви за сайта.
- Средно време за ping: в милисекунди - от сървъра на който е разположен паяка до сървъра, който се индексира. Трябва да имате предвид, че има голяма разлика между сайтове разположение в България и тези в чужбина
- Операционна система: предположение за операционната система на сървъра. Тук паякът се е издънил, защото Jabse е разположен на FreeBSD
- Уеб сървър: връща се от web сървъра ( и разбира се може да бъде манипулирано - така че не можете да му вярвате на 100%)
- Последно рестартиране: тази информация е налична за малко сървъри - но ако я има - рядкото рестартиране е плюс
- DNS: DNS сървъри обслужващи домейна. Еквивалентно е на host -t ns jabsepropaganda.com ( FreeBSD ) Ако сайтът използва собствени DNS-и би могло да означава голям сайт с достатъчно ресурси. В общия случай обаче сайтовете използват DNS сървъри, предоставени им от hosting компанията или безплатни такива, което е съвсем ОК.
- Netblock Owner: тук ще видите информация за фирмата, която управлява IP адреса, на който е разположен сайта. Това би бил интернет или хостинг доставчик, като можете да видите и информация за връзка със съответната фирма
- Whois: стандартен whois на домейна - тук ще видите информация за организацията, която е регистрирала домейна
- Alexa: Alexa може да даде много ценна информация за трафика на даден сайт, за който няма друг източник на информация. Можете да направите сравнение с някой сайт, за който имате данни. За съжаление информацията е надеждна само за по-големи сайтове.
- Netcraft: тук можете да видите информация за операционна система, web сървър и Netblock, както и данни за отминал период и промени
- Waybacк: можете да разберете как е изглеждал сайта в миналото
Край на част първа