Сколько манипуляций вешать в граммах?

Повесил на сайт поисковый движок. Стало чуть удобнее ориентироваться и перемещаться по базе знаний.

Технически всё оказалось довольно просто. Существует довольно много библиотек для статичных сайтов, я выбрал Pagefind, на Rare Styles даже написали инструкцию по установке. Из коробки работает вполне сносно.

Пошёл читать доки, как можно улучшить результаты выдачи. Везде используется классический гугловский подход ранжирования и присваивания весов. Если совсем просто: более важному контенту присваивается более высокий ранк. Для этого ты технически просто прописываешь, например, <p data-pagefind-weight="2">, помогая поисковому движку понимать, в какой очерёдности выдавать конкретный блок контента. Десятка будет выводиться на самом верху, а 0.1 — болтаться в самом низу списка (простая инструкция, как это делается). Довольно муторное занятие для ручного труда, но результат заметен сразу.

Скорее всего никогда ничего не отранжирую на этом сайте. Но подумал в контексте хайпующих сейчас искусственных интеллектов, что это ещё один прекрасный пример того, как можно манипулировать данными.

Изначально новаторский подход поисковой выдачи Гугла был в том, что бо́льший вес получают те, на кого чаще ссылаются. Позже капитализм победил, и теперь в топ попадают те, кто больше заплатил за конкретный запрос. А твой любимый ЧатГПТ решает, в каком контексте отвечать на каверзные вопросы, тоже исходя из развесовки, полученной в ходе его обучения.

История Гугла и при чём тут спец службы

Идея в том, что ты формально ничего не прячешь, не удаляешь, ничего не цензурируешь, все данные выдаются как есть. Ты всего лишь устанавливаешь веса, определяя их приоритет в выдаче. А если тебя ловят на манипуляциях — можно сослаться на технический баг.

Как иллюстрация: очередная неловкая история случалась с горячо обожаемым нами Илоном Маском, который опять немного перестарался, и в результате Грок каждый настаивал, что его хозяин сильнее любого атлета, умнее Альберта Энштейна и красивее Брэда Питта:

Скрин из поста обсуждения на Реддите

Урок в том, что каждый раз, взаимодействуя с любыми системами выдачи ответов, стоит всегда помнить о технологии, а именно:

Кто и по чьей инструкции устанавливает тут веса?

Потому что у того, кто подготовил для тебя ответ, есть собственные приоритеты и представления о том, что тебе важно знать, из чего тебе делать выбор и что в твоём выборе должно иметь определяющее значение. Технически данные не скрываются, просто некоторые из них подсвеченны жирным, а некоторые написаны мелким-мелким шрифтом в самом конце документа.