В 1998 году Google запустила свою поисковую систему, изначально названную Backrub, работая на Стэнфордском кампусе -сервере с 40 ГБ данных и размещенным в случае с блоками Duplo. По состоянию на 2025 год возможности поиска Google требуют нескольких центров обработки данных. Райан Пирс создал поисковую систему DIY под названием «Searcha Page», в том числе версия, ориентированная на конфиденциальность под названием Seek Ninja, при этом сервер расположен в его прачечной рядом с его стиральной машиной и сушилкой. Пирс заявляет: «Прямо сейчас, в прачечной, у меня больше хранения, чем Google в 2000 году. И это просто безумие, о чем думать». Сервер был изначально в спальне Пирса, но был перемещен в коммунальный зал из -за чрезмерной жары. «Жара не была абсолютно ужасной, но если дверь закрыта слишком долго, это проблема», – говорит он. Результаты Searcha Page улучшаются, а база данных содержит 2 миллиарда записей, которые, как ожидается, достигнут 4 миллиарда в течение шести месяцев. Для сравнения, в Google было 24 миллиона страниц в 1998 году и 400 миллиардов к 2020 году, как показано в ходе Antition Sult Antitom Trials US. Google LLC. Двигатель Пирса использует большие языковые модели для расширения ключевых слов и понимания контекста. «То, что я делаю, на самом деле очень традиционный поиск», – говорит Пирс. «Это то, что Google, вероятно, сделал 20 лет назад, за исключением единственной настройки, что я использую ИИ для расширения ключевых слов и помогать с контекстным пониманием, что является сложной задачей». ИИ был ключевой частью поисковых систем, включая такие инструменты, как обратный поиск изображений, Rankbrain Google и результаты Bing 90% ML в 2019 году. В настоящее время ИИ рассматривается как способ эффективного создания и масштабирования поисковых систем. Pearce использует «Арбитраж обновления», покупая старое, но мощное серверное оборудование. Его 32-ядерный процессор AMD EPYC 7532, который в 2020 году стоил более 3000 долларов, теперь стоит менее 200 долларов на eBay. «Я мог бы получить еще один чип по той же цене, у которой было бы вдвое больше нитей, но это дало бы слишком много тепла», – говорит он. Вся система стоила 5000 долларов, причем 3000 долларов потрачены на хранение. Кодовая база Пирса составляет около 150 000 строк кода, примерно 500 000 строк итеративной работы. Поиск страницы и ищите ниндзя использовать Sambanova для быстрого доступа к модели Llama 3 по низкой цене. Энни Ши Векессер, CMO Sambanova, отмечает, что доступ к недорогим моделям становится все более важным для сольных разработчиков, таких как Pearce, добавив, что компания «дает разработчикам инструменты для быстрого и доступного запуска мощных моделей искусственного интеллекта, независимо от того, работают ли они из домашней настройки или работают в производстве». Пирс использует общий репозиторий для ползания, чтобы построить своего гусеница. «Я действительно ценю их. Хотел бы я что -то вернуть им, но, может быть, когда я больше», – говорит он. Первоначальная попытка использовать векторную базу данных не удалась, что привела к «очень художественным» результатам. В настоящее время Пирс использует резюме, сгенерированные LLM, страниц. Уилсон Лин, еще один разработчик поисковой системы DIY, использует самореалированный инструмент поиска вектора под названием Corenn и опирается на девять отдельных облачных сервисов, чтобы поддерживать низкие затраты. «Это намного дешевле, чем [Amazon Web Services]- Значительная сумма, – говорит Лин. – И это дает мне достаточно возможностей, чтобы добраться до этого проекта по разумному бюджету ». Первоначально Пирс представлял небольшую поисковую систему, похожую на Marginalia, предпочитая небольшие сайты над большими технологиями. Полем Полем Я думаю, что он хотел поисковую систему без цензуры, которую он хотел прокормить свою LLM, как и поиск своего агента,-говорит он. Расширение за пределы английского языка потребует новых наборов данных. Pearce планирует перенести поисковую систему в предприятие для колокта, как только трафик достигнет определенного порога и получает скромный доход через рекламу в стиле филиала. «Я буду в том, что я буду в том, что я не буду в том, что я стану, не в том, что я не буду в том, что я не буду в том же духе. прачечная навсегда ». Крайний срок подачи заявок для самых инновационных наград компании компании – пятница, 3 октября, в 23:59 Pt.

  Руководство по быстрому ремонту Tower of Fantasy

Source: Searcha Page DIY Поисковая система соперники Google Раннее хранилище