Chmura wiedzy

Szukaj i nie poddawaj się: kto i dlaczego tworzy nowe wyszukiwarki

Duckucko idź

Kiedy w 2008 roku Gabriel Weinberg wymyślił DDG, wielu wokół niego myślało, że jest szalony - mówią, kto potrzebuje innej wyszukiwarki? Ale polegał na nowym podejściu: opracował algorytm Natychmiastowych Odpowiedzi, który umożliwił zebranie niezbędnych informacji z zasobów stron trzecich i pokazanie ich w postaci gotowej odpowiedzi na pytanie użytkownika. W niecałe sześć miesięcy podobna funkcja pojawiła się w Google, przewaga została utracona. Wtedy najpierw pojawiła się idea anonimowości i ochrony danych osobowych, która nie pozostała niezauważona. W 2012 r. Firma otrzymała inwestycję o wartości 12 mln USD od znanego Freda Wilsona z funduszu Union Square Ventures, który zauważył, że uważa, że ​​witryna może konkurować z Google: „Zainwestowaliśmy w nią, ponieważ potrzebujemy poufnej wyszukiwarki. Zrobiliśmy to dla osób siedzących Czytelnicy Reddit i Hacker News dla wszystkich anarchistów online ”. Już w przyszłym roku okazało się, że bezpieczeństwo informacji leży w interesie nie tylko anarchistów internetowych.

Świat zwrócił uwagę na DuckDuckGo w czerwcu 2013 r., Po wydarzeniach z Snowden. Liczba dziennych wyszukiwań w ciągu miesiąca potroiła się i od tego czasu stale rośnie. Faktem jest, że DuckDuckGo, w przeciwieństwie do Google i Yandex, postawiła na pierwszym miejscu prywatność danych osobowych, odmowę rejestracji, przechowywania i wykorzystywania jakichkolwiek informacji o użytkownikach. DDG nie przechowuje adresów IP, nie prowadzi rejestru twoich wyszukiwań, wyświetleń stron i kliknięć jednostek reklamowych. Za każdym razem, gdy wprowadzasz nowe zapytanie do DDG, jesteś nową osobą dla wyszukiwarki. Z tego powodu nie ma to żadnego wpływu na działanie „bańki filtracyjnej”. Na przykład Google stosuje 57 kryteriów przy ocenie, jak konkretna treść może Cię zainteresować, i zgodnie z tym filtruje wyniki dostarczania i kieruje reklamy. Mówiąc relatywnie, w Google odpowiedź na to samo pytanie dla każdego użytkownika brzmi inaczej, aw DDG - tak obiektywnie, jak to możliwe.

Wolfram alfa

WolframAlpha to wyjątkowy ambitny projekt, nad którym twórca Stephen Wolfram pracuje od 25 lat. W porównaniu do jego odpowiedzi wyniki wyszukiwania Google wydają się zaskakująco nieefektywną, bezkształtną górą informacji. WA „rozumie” naturalny język, a raczej odczytuje logikę związku między słowami w zapytaniu, a nie tylko zaznacza poszczególne słowa i ich kolejność, jak Google. WA nie wykorzystuje informacji z otwartych źródeł, ale z własnej obszernej bazy danych, która jest stale aktualizowana na podstawie żądań użytkowników. Podstawą tej bazy są dane ścisłe, matematyczne, fizyczne, astronomiczne, biologiczne i różne statystyki.

Te dane nie są statyczne, WA może z nimi pracować, porównywać i analizować. Na przykład możesz zapytać, gdzie znajduje się teraz konkretna stacja kosmiczna, jaka była pogoda w dniu urodzenia, jaki udział w rynku artykułów sportowych Nike w Wielkiej Brytanii, który z odcinków Gwiezdnych wojen był najbardziej udany. Sam Stephen Wolfram uważa, że ​​cały świat można „zdigitalizować”, dzięki czemu WA wkrótce pozna odpowiedzi na wszystkie pytania. Ale te stwierdzenia budzą wątpliwości wśród innych naukowców. Zdaniem Wolfram, ogólnie rzecz biorąc, zwyczajowo traktowane jest ostrożnie. Po opublikowaniu książki Nowy rodzaj nauki zyskał reputację szaleńca i egomaniaka. Są tacy, którzy nazywają go geniuszem, którego zwyczajny śmiertelnik nie rozumie. Główną ideą książki było to, że złożoność dowolnego systemu jest wyobrażona, a tak naprawdę wszystko na świecie jest pochodną formy bardzo prostego algorytmu. „Wszechświat to tylko 5-liniowy kod” - powiedział kiedyś.

Samuru

Brandon Wirtz długo pracował jako menedżer SEO i bardzo dobrze wiedział, jak pokonać Google. W pewnym momencie zauważył, że wyniki wyszukiwarek stają się coraz mniej wysokiej jakości, ponieważ w pierwszej dziesiątce coraz częściej pojawiają się linki nie do przydatnych zasobów, ale do stron profesjonalnie obsługiwanych przez SEO takich jak on. Wirtz postanowił stanąć po drugiej stronie barykady i stworzyć skuteczniejszą wyszukiwarkę chronioną przed spamerami. W przeciwieństwie do Google, Samuru nie przywiązuje dużej wagi do liczby linków zwrotnych. Technologia ciekłego helu przekształca zawartość strony w wartości matematyczne i algorytmy do późniejszej analizy i wykorzystania. Liquid Hel czyta informacje o strukturze tekstu, użyciu różnych części mowy, gramatyki, stylu, interpunkcji i innych wskaźników, na podstawie których można określić, jak trafny jest tekst dla zapytania i czy został on specjalnie zmodyfikowany, aby spełnić wymagania wyszukiwania.

Głównym zadaniem programistów Samuru jest uniemożliwienie przechytrzenia. Wyszukiwarka ocenia tekst według 100 kryteriów jakości. Ponadto uwzględnia inne czynniki, takie jak pilność i rodzaj wniosku. Tak więc, jeśli szukasz informacji na temat sportu i rozrywki, wyszukiwarka rozumie, że jesteś zainteresowany przede wszystkim ostatnimi lub nadchodzącymi wydarzeniami, a nie tym, co wydarzyło się kilka lat temu. Jeśli wpiszesz zapytanie „Jak zrobić babeczki” w Google, wyświetli wszystkie strony z tymi słowami, w tym główną stronę piekarni z napisem „Wiemy, jak zrobić najlepsze babeczki”. Samuru rozumie, że zapytanie „jak zrobić babeczki” jest poszukiwaniem instrukcji i szuka tekstów, które po pierwsze zawierają te słowa, a po drugie są napisane w formie instrukcji. Samuru może również ustalić, czy autor jest ekspertem w tej dziedzinie, na podstawie tego, jak często pisze na powiązane tematy. Głównym zagrożeniem dla Samuru jest to, że Google może łatwo kopiować te innowacje.

ThisPlusThat

W sierpniu blog Google Open Source opublikował wiadomość o nowym narzędziu open source word2vek. Korzystając z nienadzorowanego uczenia maszynowego opartego na sieciach neuronowych, narzędzie wykorzystuje „rozproszone reprezentacje” danych tekstowych do odkrywania związków między koncepcjami. Licencja na kod źródłowy (Apache License 2.0) pozwala na osadzanie go w aplikacjach komercyjnych. Na tej podstawie astrofizyk Christopher Moody w ciągu zaledwie trzech tygodni stworzył nową wyszukiwarkę - ThisPlusThat. Główną ideą jest przedstawienie słów nie jako jednostek, które nie są ze sobą powiązane, ale w postaci wektorów, które określają znaczenie słowa na podstawie kontekstu. Z grubsza mówiąc, jeden kierunek pokazuje, że mężczyzna, kobieta, król i królowa należą do kategorii „ludzi”, inne wektory będą kojarzone z pojęciami „płci”, „członków rodziny królewskiej” itp.

Moody „wyszkolił” algorytm przy użyciu bazy wiedzy IMDB, CrunchBase, a następnie całej Wikipedii, więc teraz wyszukiwarka „rozumie” zarówno znaczenie zwykłych słów, jak i pojęć. Możesz użyć wyszukiwarki, odcinając lub dodając niezbędne wektory do głównego słowa. Na przykład, jeśli ustawisz „Król - mężczyzna + kobieta”, wynikiem będzie „Królowa”. Dokładniejsze zapytanie, „Matryca - Przemyślany + Głupi”, spowoduje powstanie filmu Blade 2. W rezultacie podejście wektorowe nie zapewnia idealnej dokładności. Na przykład, jeśli ustawisz „Michael Jordan - koszykówka + golf”, ThisPlusThat nie poda nazwy Tiger Woods w pierwszej linii, ale pokaże Magic Johnson i Shaquille O'Neill, najwyraźniej wybierając je zgodnie z zasadą „gwiazd koszykówki, którzy z powodzeniem rozpoczęli działalność po ukończeniu studiów kariera sportowa ”. Jednak ogólnie idea „rozumienia” znaczenia słowa poprzez definicję pól semantycznych, których jest on częścią, wydaje się bardzo obiecująca.

Blippex

Blippex to bardzo młoda wyszukiwarka, której jakość zależy bezpośrednio od liczby użytkowników. Jego twórcy - Niemcy Max Kossats i Gerald Baek - opierają się na fakcie, że jeśli spróbują konkurować z Google, imitując technologię wyszukiwania i indeksowania stron, na pewno przegrają. Dlatego postanowiliśmy opracować „Wikipedię do wyszukiwania”. Użytkownicy Blippex muszą zainstalować specjalne rozszerzenie przeglądarki, które będzie anonimowo wysyłać informacje o odwiedzanych stronach, pomagając w ten sposób w tworzeniu indeksu wyszukiwania i wpływając na ocenę ważności tych lub innych informacji. Opracowany przez Kossatsa i Baeka algorytm DwellRank (nazwany przez analogię z Google PageRank) szacuje witryny na podstawie czasu spędzanego na nich przez użytkowników, a także na podstawie całkowitej liczby odwiedzających, długości treści i ogólnej popularności.

Od dawna wiadomo, że ilość czasu spędzanego na stronie jest tak naprawdę wskaźnikiem jakości treści. Dobrą rzeczą jest to, że dane gromadzone przez Blippex są całkowicie anonimowe - wyszukiwarka nie gromadzi żadnych danych osobowych użytkowników. Zła wiadomość jest taka, że ​​jakość danych wyjściowych zależy bezpośrednio od tego, ile osób zainstalowało rozszerzenie przeglądarki, więc na razie niektóre wyniki wyglądają dziwnie. Ponieważ Blippexa prawie nie ma rosyjskich użytkowników, rosyjskojęzyczne witryny wyszukiwarek praktycznie nie są indeksowane. Jednak założyciele nie są zniechęceni, wierząc, że jest to naturalny etap każdego projektu crowdsourcingowego - Wikipedia również kiedyś nie miała prawie żadnych informacji.

Obejrzyj wideo: Calling All Cars: The Flaming Tick of Death The Crimson Riddle The Cockeyed Killer (Październik 2019).

Popularne Wiadomości

Kategoria Chmura wiedzy, Następny Artykuł

Moc umysłu: 5 sposobów na rozwój inteligencji
Chmura wiedzy

Moc umysłu: 5 sposobów na rozwój inteligencji

Ilościowy umysł Na mózg, jak każda inna część naszego ciała, wpływają czynniki zewnętrzne. Jeśli na przykład spowalniasz oddychanie lub boisz się czegoś, możesz natychmiast zauważyć zmianę w postrzeganiu. Twórca Quantified Mind, Johnny Donner, zasugerował, że wielu chciałoby wiedzieć dokładnie, które czynniki pozytywnie lub negatywnie wpływają na ich zdolności poznawcze.
Czytaj Więcej
Republika Cypryjska: 3 sposoby optymalizacji podatków na byłym obszarze morskim
Chmura wiedzy

Republika Cypryjska: 3 sposoby optymalizacji podatków na byłym obszarze morskim

Listy stref przybrzeżnych zostały zaktualizowane: Ministerstwo Finansów Rosji wyrzuciło z nich Republikę Cypryjską. Oficjalną datą wykluczenia Cypru z offshore będzie 1 stycznia 2013 r., Ale teraz możemy powiedzieć, że zainteresowanie tym krajem w zakresie optymalizacji podatkowej ponownie gwałtownie wzrośnie. Cypr pozostanie atrakcyjny dla inwestorów zagranicznych, którzy nadal mogą włączać spółki na Cyprze, wykorzystując je do optymalizacji podatkowej swojej działalności.
Czytaj Więcej
5 rodzajów przedsiębiorców z Game of Thrones
Chmura wiedzy

5 rodzajów przedsiębiorców z Game of Thrones

Czwarty sezon sagi telewizyjnej Game of Thrones, opartej na powieści George'a Martina Song of Ice and Fire, dobiega końca. Producenci ogłosili, że zostaną wydane jeszcze trzy sezony epickiego dramatu o kandydatach na żelazny tron ​​Siedmiu Królestw. Wiadomo, że George Martin, choć nie ukończył prac nad najnowszymi książkami, już przemyślał losy głównych bohaterów i ujawnił je twórcom serialu.
Czytaj Więcej
Business Geek: Pinterest dla Firm, Wskazówki absolwentów LinkedIn i inne cotygodniowe hity
Chmura wiedzy

Business Geek: Pinterest dla Firm, Wskazówki absolwentów LinkedIn i inne cotygodniowe hity

Inc.: Jak korzystać z Pinteresta w biznesie Aaron O'Hanlon, dyrektor wykonawczy Footbridge Media Marketing Agency, mówi o tym, jak sieć społecznościowa zdjęć i zdjęć może pomóc w promocji Twojej firmy. Na początek radzi, aby nie postrzegać go jako bezpośredniego kanału zwiększającego ruch: na Pinterest możesz zwrócić uwagę tylko na swój produkt lub portfolio (oczywiście, jeśli wyglądają dość estetycznie).
Czytaj Więcej