По-решителен при класиране на алгоритми. PageRank алгоритъм за класиране на връзки и линейна алгебра

Авторът разказва около 30 занимателни (и поучителни) истории от областта на математиката. Една от историите говори за принципите на PageRank, алгоритъм за класиране на връзки, използван за първи път от Google. Темата е актуална и доста лесна за разбиране. И така към Стивън Строгац...

В онези далечни времена, когато Google все още не съществуваше, търсенето в интернет беше безнадеждна задача. Сайтовете, предлагани от по-старите търсачки, често не отговарят на заявката, както и тези, които отговарят необходимата информация, бяха или дълбоко скрити в списъка с резултати, или напълно отсъстваха. Алгоритмите, базирани на анализ на връзки, решиха проблема, като стигнаха до сърцевината на парадокс, подобен на дзен коаните: търсенията в Интернет трябваше да показват най-добрите страници. Какво прави страницата по-добра? Когато други също толкова добри страници се свързват към него.

Изтеглете бележката в или

Това звучи като порочен кръг. Това е вярно. Ето защо всичко е толкова сложно. Възприемайки тази идея и я превръщайки в своя полза, алгоритъмът за анализ на връзки предоставя решение за джиу-джицу за уеб търсения. Този подход се основава на идеи, взети от линейната алгебра, изучаването на вектори и матрици. Независимо дали искате да идентифицирате модели в огромни количества данни или да извършите гигантски изчисления, включващи милиони променливи, линейната алгебра разполага с всичко. необходими инструменти. С негова помощ е изградена основата за алгоритъма PageRank, който е в основата на Google. Той също така помогна на учените да класифицират човешки лица, да анализират гласуването във Върховния съд и да спечелят наградата на Netflix (дадена на екипа, който може да подобри системата на Netflix за изготвяне на препоръки за най-добрите филми с повече от 10 процента).

За да изследваме линейната алгебра в действие, нека да разгледаме как работи алгоритъмът PageRank. И за да разкрием същността му без излишен шум, нека си представим мрежа играчка, състояща се само от три страници, свързани една с друга, както следва:

Ориз. 1. Малка мрежа от три сайта

Стрелките показват, че страница X съдържа връзка към страница Y, но Y не отвръща. Напротив, Y се отнася до Z. Междувременно X и Z се отнасят един към друг.

Кои страници са най-важните в тази малка мрежа? Може би си мислите, че е невъзможно да се определи поради липсата на информация за тяхното съдържание. Но този начин на мислене е остарял. Притесненията относно съдържанието доведоха до неудобен начин за класиране на страниците. Компютрите имат малко разбиране за съдържанието и хората не могат да се справят с хилядите нови страници, които се появяват в Интернет всеки ден.

Подходът, изобретен от Лари Пейдж и Сергей Брин, студенти в университета и основатели на Google, беше да се позволи на страниците да се класират в определен ред чрез гласуване за връзки. В горния пример страници X и Y се свързват към Z, което прави Z единствената страница с две входящи връзки. Следователно това ще бъде най-популярната страница в тази среда. Въпреки това, ако връзките идват от страници със съмнително качество, те ще работят срещу себе си. Популярността сама по себе си не означава нищо. Основното нещо е да имате връзки от добри страници.

И тук отново попадаме в омагьосан кръг. Една страница е добра, ако има добри страници с връзки към нея, но кой решава кои са добри на първо място? Това се решава от мрежата. Така става.

Алгоритъмът на Google задава за всяка страница дробно числоот 0 до 1. Тази числена стойност се нарича PageRank и измерва "важността" на дадена страница спрямо другите чрез изчисляване на относителното време, което хипотетичен потребител би прекарал, посещавайки я. Въпреки че потребителят може да избира от повече от една изходяща връзка, той избира една на случаен принцип с еднаква вероятност. С този подход страниците се считат за по-авторитетни, ако се посещават по-често.

И тъй като индексите на PageRank се определят като пропорции, тяхната сума в цялата мрежа трябва да бъде 1. Този закон за запазване предлага друг, може би по-осезаем начин за визуализиране на PageRank. Представете си го като течна субстанция, която тече през мрежата, чието количество намалява при лоши страници и се увеличава при добри. Използвайки алгоритъм, ние се опитваме да определим как тази течност се разпределя в Интернет във времето.

Отговорът ще бъде получен в резултат на следния многократно повторен процес. Алгоритъмът започва с предположение, след това актуализира всички стойности на PageRank, разпределяйки течността поравно между изходящите връзки и след това обикаля няколко пъти, докато достигне определено състояние, при което страниците получават своя справедлив дял.

Първоначално алгоритъмът задава равни дялове, което позволява на всяка страница да получи еднакво количество PageRank. В нашия пример има три страници и всяка от тях започва да се движи според алгоритъма с резултат 1/3.

Ориз. 2. Първоначални PageRank стойности

След това резултатът се актуализира, за да покаже действителната стойност на всяка страница. Правилото е, че всяка страница взема своя PageRank от последния кръг и го разпределя равномерно между всички страници, към които препраща. Следователно актуализираната стойност на страница X след първия кръг все още е 1/3, тъй като това е колко PageRank получава от Z, единствената страница, която има връзка към нея. Това намалява резултата на страница Y до 1/6, тъй като тя получава само половината от PageRank на X след предишния кръг. Втората половина отива на страница Z, което я прави победител на този етап, тъй като тя добавя още 1/6 от страница X, както и 1/3 от Y, за общо 1/2. Така след първото кръгче имаме следните стойности на PageRank:

Ориз. 3. PageRank стойности след една актуализация

В следващите кръгове правилото за актуализиране остава същото. Ако означим с x, y, z текущия брой страници X, Y и Z, тогава в резултат на актуализацията получаваме следния брой:

z’ = ½ x + y,

където щрихите показват, че е настъпила актуализация. Удобно е да извършвате такива повтарящи се изчисления в електронна таблица (или ръчно, ако мрежата е малка, както в нашия случай).

След десет повторения ще открием, че числата практически не се променят от актуализация на актуализация. В този момент делът на X ще бъде 40,6% от общия PageRank, делът на Y ще бъде 19,8%, а Z ще бъде 39,6%. Тези стойности са подозрително близки до числата 40, 20 и 40%, което предполага, че алгоритъмът трябва да се сближи с тях. Това е вярно. Алгоритъмът на Google определя тези ограничаващи стойности за мрежата като PageRank.

Ориз. 4. Ограничения на PageRank

Заключението за тази малка мрежа е, че страниците X и Z са еднакво важни, въпреки че Z има два пъти повече входящи връзки. Това е разбираемо: страница X е равна на Z по важност, тъй като получава пълно одобрение от нея, но в замяна й дава само половината от одобрението си. Другата половина отива при Y. Това също обяснява защо Y получава само половината от дяловете на X и Z.

Интересното е, че тези стойности могат да бъдат получени без да се прибягва до множество повторения. Просто трябва да помислите за условията, които определят стационарно състояние. Ако нищо не се промени след следващата актуализация, тогава x’ = x, y’ = y и z’ = z. Следователно, замествайки променливите с първични числа в актуализираните уравнения с техните еквиваленти без прости числа, получаваме система от уравнения

при решаване на x = 2y = z. Тъй като сумата от стойностите на x, y и z трябва да е равна на 1, следва, че x = 2/5, y = 1/5 и z = 2/5, което съответства на предварително намерените стойности.

Трудностите започват там, където има огромен брой променливи в уравненията, както се случва в реална мрежа. Следователно, един от централните проблеми на линейната алгебра е разработването на по-бързи алгоритми за решаване на големи системи от уравнения. Дори незначителни подобрения в тези алгоритми се усещат в почти всички области на живота – от разписанието на полетите до компресирането на изображения.

Въпреки това, най-значимата победа на линейната алгебра, по отношение на нейната роля в Ежедневието, със сигурност се превърна в решението на парадокса на дзен будизма за класиране на страници. „Една страница е толкова добра, колкото са добри страниците, които препращат към нея.“ Преведен в математически символи, този критерий се превръща в алгоритъма PageRank.

Търсачката Google стана това, което е днес, като реши уравнението, което вие и аз току-що решихме, но с милиарди променливи - и съответно с милиарди печалби.

Според Google терминът PageRang идва от съоснователя на Google Лари Пейдж, а не от английска думастраница (страница).

За простота ще представя само основната версия на алгоритъма PageRank. За да работи с мрежи с някои други структурни свойства, той трябва да бъде модифициран. Да предположим, че има страници в мрежата, които се свързват с други, но те от своя страна не се свързват с тях. По време на процеса на актуализиране тези страници ще загубят своя PageRank. Дават го на други и вече не се попълва. Така те ще се окажат със стойности на PageRank, равни на нула, и от тази гледна точка ще станат неразличими.

От друга страна, има мрежи, в които някои страници или групи от страници са отворени за натрупване на PageRank, но не се свързват с други страници. Такива страници действат като PageRank акумулатори.

За да избегнат подобни резултати, Брин и Пейдж модифицираха алгоритъма си, както следва. След всяка стъпка в процеса на актуализиране на данните всички текущи стойности на PageRank се намаляват с постоянен коефициент, така че сумата им да е по-малка от 1. След това оставащият PageRank се разпределя равномерно между всички възли в мрежата, сякаш „пада от небето." По този начин алгоритъмът завършва с действие за изравняване, което разпределя стойностите на PageRank между най-лошите възли.

Математиката на PageRank и интерактивните изследвания се обсъждат по-задълбочено в E. Aghapour, T. P. Chartier, A. N. Langville и K. E. Pedings, Google PageRank: The mathematics of Google (

За какво е система за търсенеи как класира сайтове, писах в общи линии още в статията от 8 август.
Там разгледахме какво представлява търсачката, как научава за нови сайтове и как определя реда, в който сайтовете се показват в резултатите от търсенето за дадена заявка. Отново това бяха общи и по-абстрактни понятия. Днес ще говорим за конкретен алгоритъм за класиране в търсачката Yandex.

През 2009 г. търсачката Yandex премина към нов алгоритъм за търсене - Snezhinsk, който използва технологията Matrix. Net (Matrixnet). Но всичко това са думи и не ни казват нищо. Какво е Matrixnet? И какво общо има с това град Снежинск? Ще се опитаме да го разберем постепенно.

Така през ноември 2009 г. Yandex получи ново търсене. За да разберете смисъла на новото търсене, струва си да се обърнете малко към историята и да разберете какво е било старото? Все пак самият аз започнах да уча SEO в края на 2009 г., т.е. когато Снежинск с Matrixnet вече беше внедрен. Как беше изградено търсенето на подходящи документи в търсачката Yandex до Снежинск?

Не забравяйте, че търсачката е просто робот, машина, базирана на математическа логика. Тези. Можете да поставите математически формули в програмата, x=1, y=3, x

Например x=онлайн оптимизация, y=външни връзки и т.н. На всяка такава променлива беше присвоен определен номер и имаше стотици такива променливи. След това всички показатели бяха „сумирани“, т.е. на всеки сайт беше присвоен определен номер, в съответствие с който се извърши класирането, сайтовете бяха подредени в определена последователност в резултатите от търсенето. Естествено, това е най-примитивният пример, само за да предаде същността.

До какво доведе това в крайна сметка? Въпреки че тайната на формулата никога не беше разкрита, всички знаеха, че определени индикатори на уебсайтове са взети като основа и естествено това доведе до факта, че всеки оптимизатор с аналитични умения може емпирично да идентифицира определен брой значими параметри, които влияят на класирането, и започнете да ги използвате за промоция, т.е. изкуствено повлияват резултатите от търсенето. Настройте уебсайта си към конкретни показатели.

И тъй като оптимизаторите се научиха да влияят на резултатите от търсенето, това означава, че сайтовете започнаха да се появяват на първите места, които, въпреки че съответстват на заявката за търсене, но, като са в горната част, не дават възможност да стигнат до върха за други сайтове, които също могат да бъдат интересни и полезни за хората. И най-тъжното в тази ситуация беше, че имаше много търговски сайтове в горната част, които имаха възможност да харчат пари за промоция.

Какво донесе новият алгоритъм за търсене Snezhinsk със своята технология Matrixnet? Опитах се да проуча възможно най-пълно информацията за този алгоритъм за класиране и ще се опитам да ви предам същността му.

Основата не е взета върху конкретни показатели на сайта, а върху самите сайтове, които според служителите на Yandex са полезни ресурси от човешка гледна точка. Колко обективна беше оценката на тези сайтове? Не можем да преценим обективността на подхода към това. Но нека просто го приемем на вяра.

Нека пропуснем куп отрицателни отзиви от оптимизатори, че Yandex е търговска организация, че не се интересува от потребителя, а се интересува само от печелене на пари от контекстни реклами. Моето лично мнение е, че винаги нещо пречи на лошия танцьор :).

Yandex винаги заявява, че основната му задача е да предостави отговор на потребителя. Нека приемем това като аксиома. И ще вярваме, че сайтовете са избрани за новия алгоритъм по обективни критерии.

И така, бяха избрани определен брой конкретни заявки и определен брой сайтове, които най-пълно отговарят на тези заявки. И специално обучени хора, оценители, съпоставяха всяка заявка с определен документ. Тези. по тяхно обективно-субективно мнение заявка 1 отговаря на сайт А, заявка 2 на сайт Б и т.н.

Всяка такава двойка „заявка=документ“ беше анализирана от машина (програма), която откри модели сред тези документи (естествено, въз основа на същата математическа логика) и въз основа на идентифицираните модели изведе формула. Именно според тази формула всичко започна да се класира в търсачката Yandex. Но има редица предупреждения.

Първото предупреждение е, че има много такива формули. Мога да предположа, че почти всяка тема и фокус имаше своя собствена формула. защото Невъзможно е по едни и същи критерии да се оценяват комерсиални и некомерсиални сайтове, сайтове с развлекателна цел и сайтове с научни трудове.

Второто важно предупреждение е, че за да се изведе формулата, определени променливи трябваше да бъдат поставени в машината във всеки случай, т.е. индикатори на уебсайта. Базата, на която машината ще сравнява сайтовете един с друг.

И отново, как можете да сравнявате сайтовете един с друг? Разбира се, вътрешните и външните фактори не могат да не бъдат взети предвид тук. Но те вече не са решаващи. В светлината на последните изявления на Yandex относно , какви други показатели могат да бъдат решаващи при класирането на сайтове?

Все повече се говори за такъв фактор за класиране като поведенческия фактор.

И именно той, според мнозина и според резервите на представители на Yandex, е решаващ в класирането. И до известна степен това наистина може да е вярно.

И така, какво прави новия алгоритъм уникален? Първо, човешкият фактор е този, който определя колко интересен е един сайт от друг. От една страна, човешкият фактор е субективно мнение, на един му харесва едно, на друг друго. Но тук въпросът е по-скоро не за интересността, а за това документът да дава изчерпателен отговор на зададения въпрос. И на този принцип бяха избрани документи и присвоени на определени заявки.

И се оказва, че от друга страна се опитват да научат една машина да мисли като човек. Второто следва от първото, служителите на Yandex учат машината да намира модели в човешкото мислене. Машината намира тези модели (дали добри или лоши е друг въпрос) и въз основа на тези модели изгражда своята формула и съответно резултатите от търсенето.

И всъщност технологията Matrixnet не е нищо повече от машинно обучение.

Благодарение на това е по-вероятно резултатите от търсенето да включват полезни ресурси, в които потребителят действително намира отговора на своя въпрос. И тук важното е, че за да стигнете до върха на Yandex, не е нужно да сте стар доверен ресурс, не е нужно да купувате голям брой връзки.

Важно е интересното, полезно съдържание и ясният интерес на потребителите на мрежата към сайта.

Да, но какво общо има Снежинск? Факт е, че в новия алгоритъм е подобрена формулата за класиране на регионалните заявки. Тези. Където и да се намира потребителят и каквито и заявки да въвежда, ще се дава приоритет на регионални сайтове, сайтове на онези организации, които се намират в същия регион като потребителя.

В следващите статии ще разгледам по-подробно всички възможни фактори, които влияят върху класирането на сайтовете, естествено, въз основа на твърдения от официални източници. И естествено е невъзможно да се даде изчерпателен отговор на факторите, т.к всичко, което може да повлияе на класирането на сайтовете, е тайна и не се разкрива от представители на Yandex. Освен това ще се опитам да обърна повече внимание на поведенческия фактор, по какви критерии се определя поведението на потребителя и защо това е „основният“ фактор. Следете актуализациите на блога.

Все повече и повече хора се интересуват от работа на свободна практика и авторът на блога seolabel.ru обещава да говори за това какво може да бъде работата у дома. Може би ще намерите нещо интересно за себе си.

В допълнение към графичните и теоретико-множествените, те често използват алгебрично представянеграфика в матрична форма.

Помислете за диграфа Жсъдържащи нвърхове и мребра Матрица на съседстводиграф Жнаречена матрица Аразмер нн

Понякога се извиква матрицата на съседство матрица на отношенията, или матрица на директните връзки.

Матрица на инцидентите(или матрица на инцидента) диграф Жнаречена матрица бразмер нм, в който

За да въведете матрицата на съседство, трябва да номерирате върховете, а за матрицата на инцидентност - ръбовете на графа.

Алгебричното представяне ни позволява да алгоритмизираме в удобен за компютърно програмиране вид процедурата за определяне на структурните количествени параметри на системата.

Нека сега разгледаме някои методи за решаване на практически проблеми, използвайки математическия формализъм, който въведохме.

Класиране на елементите на системата

Анализирането на връзките в графа се състои преди всичко в намирането и оценката на пътищата между неговите върхове. В допълнение към директното намиране на път в определена комуникационна система, този проблем включва, например, проблемът за избор на оптимална стратегия и т.н. Наистина, достатъчно е да асоциирате върховете на графа с някои цели и дължините на пътищата с разходите за постигане на тези цели, за да се получи проблемът за избор на стратегия за постигане на целта с най-ниска цена.

Намирането на пътища с помощта на чертеж със сложна графова структура (на практика трябва да анализирате графи с повече от 100 върха) е трудно и е свързано с възможност за грешки. Нека разгледаме един от алгебричните методи, който е удобен за използване на компютър. Този метод позволява, въз основа на матрицата на директните връзки , изграждане пълна матрица на пътя
, Където - брой пътища от върха аздо горе й(= 0), или да се ограничим до намирането на един от неговите елементи.

Числа или техните буквални изрази се определят с помощта на специален вид квалификатор - квазинепълнолетни(неподписандетерминанти). Формулата е валидна

.

Изразяване
Наречен квази-минорен елементматрици . Знак
е квази-минорен символ и
сочи към матрица със зачеркнато лти ред и кколона, която се вписва в квазиминорния символ като матрица, която се вписва в символа на обикновен минорен.

Изчисляването на квазиминор се свежда до разлагането му на квазиминори от по-нисък ред съгласно формулата

Процедурата за изчисление е в много отношения подобна на процедурата за изчисляване на конвенционалните детерминанти, но овладяването на този метод изисква известно умение.

Пример.

Нека матрицата на преките връзки има формата

Необходимо е да се намерят всички пътища, водещи от връх 1 до 5, и да се преброи техният брой.

За разглеждания пример получаваме

Първоначално в матрицата Колона 1, съответстваща на номера на върха, от който започва пътеката, и ред 5, съответстващ на номера на върха, в който завършва пътеката, са задраскани. Това съответства на премахване от графиката на всички ребра, водещи до връх 1 и напускане на връх 5. По-удобно е да оставите позицията и номерирането на останалите редове и колони непроменени. След това е необходимо да се разшири полученият квазиминор в ненулеви елементи от 1-ви ред

Разширяването за първия член се извършва на втория ред, вторият - на третия, третият - на четвъртия, т.е. номерът на реда, на който се извършва разгъването, е равен на номера на колоната, в която се намира последният член на разгъването.

Ако сега поставим за ненулеви елементи = 1 и изпълняваме операции според правилата на обикновената аритметика, получаваме -
.

Ако извършим действия в получения израз според правилата на булевата алгебра, получаваме стойността пълна матрица на връзките, което характеризира графична свързаност. Стойности на елементите на пълната матрица на свързване се определят, както следва:

= 1, ако връх i е свързан с връх j с поне един път,

=0 в противен случай.

Обикновено се смята, че
.

Свързаността е най-важната характеристика на структурната диаграма на системата. Колкото по-добра е пълнотата на пълната матрица от връзки, толкова по-добра е структурата. Наличието на голям брой нули показва сериозни недостатъци в структурата на системата.

Друга важна характеристика на структурата е разпределението на важността на елементите на системата. Количествена характеристика на значимостта - ранг на елемента- за първи път е изрично формулиран при анализа на структурата на отношенията на господство (превъзходство, господство) в групи от индивиди (хора, животни).

Използване на матрицата на пълния път
, стойностите на ранга на елементите се определят по формулата

.

Трябва да се има предвид, че значимостта на даден елемент не се определя от самата стойност , но чрез сравняване на ранговете на всички елементи, т.е. ранг е относителен индикатор за важност.

Колкото по-висок е рангът на даден елемент, толкова по-голям е броят на пътищата, по които той е свързан с други елементи и толкова по-голям е броят на елементите, чиито нормални работни условия ще бъдат нарушени, ако той се повреди. Ето защо при формирането на програма за осигуряване на надеждността на разглежданата система е необходимо да се обърне специално внимание на елементи с висок ранг.

За системи с мрежова структура, наличието на елементи със значително по-висок ранг от тези на другите обикновено показва функционално претоварване на тези елементи. Препоръчително е да се преразпределят връзките и да се осигурят заобиколни решения, за да се изравни важността на елементите на дадена система.

Има и други методи за определяне на ранговете. Изборът на подходяща техника се определя от спецификата на задачата.

Трябва да се отбележи, че има структури, чието класиране на елементи може да загуби практическо значение. Това са преди всичко йерархични структури. Значимостта на даден елемент в тях се определя от нивото на йерархията.

PageRank е числена стойност, която характеризира „важността“ на уеб страницата на даден уебсайт. Колкото повече връзки водят към страница на сайта и колкото по-високо качество са те, толкова по-„важна“ става страницата. В допълнение, „теглото“ на страница A се определя от теглото на връзката, предадена от страница B. По този начин PageRank е метод за изчисляване на тежестта на страница чрез изчисляване на важността на връзките към нея.

Този метод на изчисление е патентован от разработчиците и съоснователите на търсачката Google Сергей Брин и Лари Пейдж. Прочетете по-подробно текста на изследването (на английски). На руски .

Какво е теглото на страницата на уебсайта?

Под тежестта на страницата е степента на нейната важност. Ако направим аналогия с човешките взаимоотношения, тогава фразата „думата му има тежест“ ще отразява същността на понятието „тежест на страница на уебсайт“.

Теглото на страницата се изразява в конкретни числа и може да се изчисли.

Обикновено има два вида тегло на страницата:

  1. Статично тегло (определено число), което се изчислява на базата на независими от заявката фактори – това са всички фактори, които не са свързани със заявката за търсене. Например възрастта на сайта, неговите страници, датата на индексиране на страниците, броя на вътрешните и външните връзки, водещи към страницата.
  2. Динамично тегло, което се изчислява въз основа на фактори, зависими от заявката - това са всички фактори, които са свързани със заявката за търсене (текст). Текстът на заявката се сравнява с текста на страницата на сайта, следователно факторите, зависими от заявката, са тези, които зависят основно от текстовите елементи на страницата - нейното заглавие, описание на описанието, текст върху нея, котви (текстове) на връзки, които сочат към него и произлизат от него.
Алгоритъмът PageRank определя статичното тегло на страницата, а не динамичното. С други думи, статичното тегло на една страница е нейният PageRank. В сайта може да има страница без съдържание, но ако поне една връзка води към нея, тогава тя ще има статична тежест.

Статичното тегло се отчита от търсачките във фонов режим и се присвоява на страницата на сайта. След определено време се преизчислява. Динамичното тегло не се изчислява във фонов режим, а в движение, когато потребителят изпрати заявка за търсене към търсачката, за да намери резултати.

Как изглежда формулата PageRank?

Никой не знае как точно Google изчислява PageRank. Но можете да се съсредоточите върху тази формула, предложена от Сергей Брин и Лари Пейдж в тяхното проучване.

PR(A)=(1-d)+d(PR(T_1)/C(T_1) +⋯+PR(T_n)/C(T_n)) , Където

PR(A) - тегло на акцепторната страница A (към която е поставена връзката)

PR(T_n) - тегло на донорската страница, свързваща страница A (от която е поставена връзката)

C(T_n) - брой връзки от донорската страница

D е коефициентът на затихване, обикновено се приема равен на 0,85. Във вероятностния модел това означава, че потребителят изобщо няма да последва връзката, а ще затвори страницата на сайта. На това събитие е определена вероятност от 15%. Останалите 85% са дадени на връзки.

1-d е елемент, който е необходим, за да се гарантира, че формулата няма да стане нула, ако теглото на свързващите донорни страници е равно на 0. Това означава, че дори най-незначителната страница на сайта може да предаде някакво минимално тегло чрез връзката .

Формулата може да се напише по следния начин

Теглото на страницата-акцептор на сайта е равно на сбора от теглата, предадени чрез връзки от страниците-донори към страницата-акцептор.

Пример

Ако уебсайт се популяризира в областта на продажбата на ролетни щори, тогава трябва да намерим страници на донорски сайтове с висок PageRank. Когато общувам, не анализирам стойността на PageRank на всяка страница от сайта, с която искам да проведа обхват, защото... такава страница може да е на спам сайт. Фокусирам се върху темата на дарителската страница и такава страница да бъде в ТОП 10 на търсачката за тематични информационни запитвания, свързани с рекламирания продукт/услуга и върху индикаторите, по които проверявам всеки потенциален дарителски сайт преди да напиша предложение на неговия собственик или лицето, отговорно за публикуването на материали в него, относно публикуването на връзка или споменаване.

Ако една страница е на първа страница с резултати от търсенето, тогава алгоритъмът за търсене я счита за висококачествена, за да бъде в ТОП 10 на търсената заявка, която ни интересува. Трябва да се опитате да получите активна връзка или споменаване от такава страница, защото вече има трафик от търсене и връзка, поставена на такава страница, ще има голяма вероятност да бъде последвана от потребителите поради това, че е в ТОП.

Сисадмин(известен още като на английски системен администратор, системен администратор) - съкратено наименование на професия, чието пълно име на руски звучи като Системен администратор. Тази професия напоследък стана много популярна сред повечето млади и не толкова млади хора, те я преподават, работят в нея и получават добри пари за това. Това се дължи на бързото развитие на различни компютърни технологии и тяхното навлизане във всички сфери на човешкия живот. Думата системен администратор често се използва в разговорната реч, в обяви и автобиографии при търсене на работа, с една дума - навсякъде. По-долу ще говорим за това каква е професията на системния администратор.

В съвременните реалности системен администратор може да се нарече практически всяко лице, което се занимава с обслужването и поддържането на работата на определена компютърна мрежа, включително всички нейни хардуерни и/или софтуерни компоненти, които могат да включват:

  • Персонални компютри, работни станции и сървъри;
  • Мрежово оборудване като комутатори, рутери, защитни стени и други;
  • Уеб сървъри, пощенски сървъри, сървъри за бази данни и други.

Освен това в определени случаи системният администратор може да носи отговорност за осигуряването на подходяща сигурност на информацията.

В зависимост от своята специализация системният администратор може да извършва следните дейности:

  • Администратор на работни станции и сървъри най-често ремонтира както хардуер (повредени дънни платки, изгорели захранвания), така и софтуер (Windows не зарежда, запетаи не се печатат в Word...).
  • Администратор на корпоративна мрежа, базирана на домейн Active Directory. Много популярна дейност, като се има предвид разпространението на операционните системи Windows, както и необходимостта от някак централно управление. Такъв специалист трябва да може да създава, разпределя в групи, редактира потребители, да им дава съответните права в домейна на AD, както и да може да управлява групови политики за потребителите, техните компютри и групите, в които всички те са членове.
  • Администриране на мрежи и мрежово оборудване. Неговите отговорности включват познаване на топологията на мрежата, способност за работа както с неконфигурируемо, така и с персонализирано мрежово оборудване, планиране на локална компютърна мрежа, както и способност за комбиниране на няколко отдалечени работни станции в една мрежа чрез настройка на NATs и VPNs "ov. Също така не трябва да забравяте да контролирате достъпа в тази мрежа и извън нея - настройка на прокси.
  • Администратор на уеб сървър, който трябва да може поне да инсталира, конфигурира и поддържа един от следните уеб сървъри - Apache, IIS, Nginx и да наблюдава хостинг (който може да бъде разположен както в мрежата на организацията, така и извън нея). В допълнение, добрият администратор трябва да може да конфигурира нормално разпределение на ресурсите при високи натоварвания, групиране и много други специфични неща.
  • Администрирането на пощенски сървър също е често срещана задача за системния администратор; неговите задачи включват работа с популярни решения като Exim, Microsoft Exchange, Postfix, Sendmail или решения за корпоративна поща от Google или, например, Yandex. В допълнение към очевидния контрол върху акаунтите (създаване, изтриване, конфигуриране), е необходимо също така да можете да настроите антиспам система и т.н.
  • Администратор на сайта. Тези отговорности може да включват просто попълване на сайта с някакво съдържание, но тъй като говорим за системен администратор, тогава на теория той трябва да може да настрои хостинг (включително уеб сървър, както беше споменато по-горе), да инсталира и конфигурира желания сайт , например всяка система за управление на съдържанието (CMS).
  • Много рядко отговорностите на системния администратор могат да включват задачата да създаде или поддържа система за видеонаблюдение. Задачите включват инсталиране и конфигуриране на камери, реагиране на различни събития, запазване и възпроизвеждане на записи. Той има слабо отношение към системната администрация и често попада в своите отговорности заедно с някои други отговорности.

Извън професиите на системния администратор, описани по-горе, са такива възможни неща като администриране на бази данни (Microsoft SQL, MySQL и неговите множество клонове, Oracle и т.н.), 1C администриране (да не се бърка с „1C програмист“), PBX и много други .