Использование браузера на самом деле бесплатно, по крайней мере, если вы готовы и можете потратить некоторое время на изучение кода API. Я не очень разбираюсь в коде, но наивно полагал, что достаточно знаю, как работает GitHub, чтобы использовать версию API. Потратив несколько часов на чтение документации, настройку параметров и просмотр примеров, я решил, что для этого требуется более глубокий уровень знаний в области кодирования, чем тот, который есть у меня, не говоря уже о среднестатистическом человеке, просматривающем веб-страницы.
К счастью для меня, Browser Use только что запустил облачную версию, которая использует собственную модель OpenAI GPT-4o. Это устраняет большую часть тяжелой работы и упрощает процесс до более привычного формата чата без какой-либо дополнительной работы. Он имеет свои ограничения и стоит 30 долларов, но после моих раздумий с API, он показался мне выгодным приобретением. И даже в этой (явно еще незаконченной) форме вам все равно придется приложить некоторые усилия для разработки подсказок и договориться о том, как должен работать ИИ. Самым ограничивающим аспектом является то, что вы можете дать только одну подсказку перед началом нового взаимодействия. Несмотря на наличие текстового поля, вы не можете ответить на действия ИИ и развеять свои сомнения.
Buying AI
После того, как все было настроено, я провел несколько реальных тестов использования браузера. Сначала ставится задача сравнения цен. Я ввел запрос: «Перейдите на Amazon, Best Buy и Walmart и найдите «MacBook Air M2». Извлеките название продукта, цену и наличие на складе из первых пяти результатов с каждого сайта. Сравните цены и найдите самую низкую цену цена. Если есть скидки или купоны, обратите на них внимание. Дайте окончательный обзор с лучшими предложениями и где купить».
Хотя он не нашел никаких скрытых скидок или купонов, он проделал хорошую работу. Однако тот факт, что я могу автоматически отслеживать цены на нескольких сайтах, весьма воодушевляет. Однако постоянная проблема с любым подобным прокси-сервером возникает, когда веб-сайт хочет проверить, являетесь ли вы человеком. Браузер использует кнопку, которая позволяет вам в любой момент взять управление в свои руки, но также выдает предупреждение при необходимости. Вы можете доказать свою человечность и нажать «Продолжить», чтобы снова передать управление ИИ.
Искусственный интеллект полета
Далее следует задача по планированию поездки с подсказкой: «Найдите рейсы туда и обратно из Нью-Йорка в Лондон 15 декабря 2025 года с British Airways. Выберите самый дешевый вариант и извлеките подробную информацию, включая цену, авиакомпанию и время вылета».
Используя браузер, вы можете найти билет на рейс British Airways стоимостью 750 долларов, включая время вылета и другую важную информацию. Это отлично подходит для людей, которые часто бронируют поездки, особенно если вы автоматизируете процесс для регулярной проверки скидок.
Друг хорошей погоды с искусственным интеллектом
наконец, я проверил прогноз погоды и план с помощью подсказки: «Проверьте 7-дневный прогноз погоды для Нью-Йорка на weather.com, в котором обобщены тенденции температуры, вероятность осадков и предупреждения об опасных погодных условиях, а затем используйте подсказку подсказать, как одеваться. «Вот и все».
Погода — одно из самых популярных применений голосовых помощников, поэтому мне захотелось посмотреть, как ИИ справится с этим более сложным запросом. Он не только может извлечь информацию из прогноза погоды, но и подсказать, в какие дни следует надевать легкую куртку, а в какие — «надевать более толстое пальто и шарф, потому что будет холодно и маловероятно, что будет дождь».
Power trip
Главное различие между ними — доступность. Использование браузера для разработчиков — это как швейцарский армейский нож. Он позволяет вам делать практически все, что угодно, в вашем браузере, но вам нужно знать, как пользоваться инструментами. Вы можете погрузиться в код, настраивая и корректируя его в соответствии со своими конкретными потребностями. Если какой-то функции не хватает, ничто не мешает вам ее добавить. Browser Use — это программное обеспечение с открытым исходным кодом, имеющее активное сообщество разработчиков, которые постоянно его совершенствуют. Это означает, что если у вас возникнут проблемы, вы сможете найти ответы на форумах и в обсуждениях GitHub.
С другой стороны, Operator от OpenAI — это как нанять дворецкого. Он многое для вас делает, но есть определенные ограничения. Преимущество Operator заключается в его интеграции с более широкой экосистемой искусственного интеллекта OpenAI, что дает ему доступ к собственным моделям, позволяющим принимать более взвешенные решения. Однако на вас распространяется ценовая политика OpenAI и ограниченные возможности настройки.
Использование браузера не является идеальным вариантом. Даже его облачная версия требует некоторого терпения. Вам нужно тщательно продумать свои подсказки, быть готовым устранять неполадки и иногда начинать все сначала. Облачная версия, возможно, в будущем компенсирует некоторые из этих недостатков, но в настоящее время невозможность редактировать или отвечать во время разговора серьезно ограничивает ее гибкость.
В настоящее время использование браузера лучше всего подходит для людей, которые любят возиться с вещами, например, разработчиков, исследователей и специалистов по автоматизации, которые не против испачкать руки. Если вы готовы приложить усилия, вы получите мощный, гибкий инструмент, который стоит гораздо дешевле, чем у конкурентов.
Но если вы не хотите тратить все выходные на борьбу с файлами конфигурации, Operator может оказаться более щадящим вариантом. Несмотря на это, автоматизация сетей будет процветать.
DeepSeek: почему все говорят про китайский ИИ? | Чат-бот конкурирует с ChatGPT. Причем здесь Nvidia?
Рекламный уголок Для иностранных компаний → EasyStaff: платите удаленным сотрудникам по B2B-договору на ...