Добавка: перевод второй части.
Cursor — это IDE, форк VS Code, который по задумке авторов должен работать сильно иначе, а именно использовать всю мощь ИИ-агентов, которые запускаются в облаке.
Из интересного — он очень популярен:
Стартап, стоящий за Cursor — Anysphere, был основан в 2022 году, а в марте 2023 года запустил Cursor. Недавно Anysphere сообщила, что привлекла $900 млн, при оценке компании в $9.9B. Годовой доход уже превысил $500M. Ни одна другая компания в сфере инструментов для разработчиков, которую я знаю, не достигала этого рубежа в течение первых 2 лет после запуска первого продукта. Поспособствовало этому и то, что Cursor используется более чем половиной из 500 крупнейших технологических компаний из списка Fortune 500.
Знакомые из стран, где его можно легко использовать, кайфуют, правда нравится.
Технологический стек. TypeScript, Rust и куча облачных провайдеров — Turbopuffer, Datadog, PagerDuty и другие.
TypeScript — это потому что VS Code изначально на нём написан, Rust — это для производительности.
Статья не сильно большая, продолжение (вторая часть) следует, проект очень свежий, много про технологии. Короче, мне было интересно почитать.
Здравствуйте, Nuzhny, Вы писали:
N>Cursor — это IDE, форк VS Code, который по задумке авторов должен работать сильно иначе, а именно использовать всю мощь ИИ-агентов, которые запускаются в облаке.
Так это может закончиться тем, что языком программирования станет некоторое подмножество разговорного человеческого языка, но это неточно. Будет такой "COBOL Ultra Plus AI". Кто видел кобол хотя бы издалека — те меня могут понять.
А если серьезно, то в человеческом языке много противоречий и неоднозначностей, много смыслов, много прочтений. Даже мы, люди, по-разному понимаем одни и те же слова, по-разному воспринимаем одни и те же фильмы, по-разному воспринимаем одних и тех же людей — и это нормально (см. "архетипы" в юнгианстве).
Как вот тогда доверять таким "программам"? Тут, вон компиляторы C++ иногда не могут договориться между собой в том, как трактовать код (разные парсеры, немного отличается семантика), а тут — человеческий язык.
Я правильно понимаю суть этих ИИ-агентов, или ошибаюсь? ИИ-агенты обладают свойством детерминированности? Или их результат работы зависит, скажем, от фазы луны? И это не фигура речи. Мне действительно интересно. Есть детерминизм или нет? Это фундаментальное свойство систем программирования, если что.
Просто я почти не соприкасался с этим ИИ. Что я увидел — сделало меня скептиком после мимолетного вау-эффекта. Вау-эффект был — каюсь. И забавно наблюдать со стороны на весь этот масштабный движ в узких кругах программистов на фоне того, что происходит в мире более глобального и значимого
Здравствуйте, dsorokin, Вы писали:
D>Я правильно понимаю суть этих ИИ-агентов, или ошибаюсь? ИИ-агенты обладают свойством детерминированности? Или их результат работы зависит, скажем, от фазы луны? И это не фигура речи. Мне действительно интересно. Есть детерминизм или нет? Это фундаментальное свойство систем программирования, если что.
1. Детерменированность — может быть, а может и не быть. За это отвечает особый параметр, который называют температурой. Можно их запускать с такой настройкой, при которой они будут максимально детерменированы и на одни и те же входные данные выдавать один и тот же ответ. А можно повышать температуру и ответы будут разными. Грубо говоря, нейросеть учится предсказывать следующий токен (можно принять, что токен — это слово), при предсказании будет N вариантов, каждый со своей вероятностью. При нулевой температуре выбирается наиболее вероятное словое, а чем выше температура, тем больше вероятности взять менее вероятное слово.
2. Я думаю, что тебя больше волнует не детерменированность, а устойчивость, а именно, насколько сильно влияет на ответ небольшое изменение входных данных. Вот с этим уже похуже в общем случае. Тут приводили примеры, как эмоциональный окрас вопроса может влиять на качество ответа.
3. Ещё более важно, как ведут себя нейросети с математикой и программированием. Насколько я понимаю, в этих областях они намного, намного лучше гуманитарных за счёт того, что при обучении есть точные ответы. Также уже научились обучать не просто на точных ответах, но и на промежуточных рассуждениях, что ещё намного круче.
4. Ещё важный момент — доверие к тому, что выдаёт модель. Тут увеличили точность, во-первых, с помощью рассуждений, и, во-вторых, агентные системы — это не одна большая нейросеть, а множество нейросетей со своей специализацией. Это может быть и одна нейросеть, но с разными инстансами и разными промтами для каждого. Это делает ответы более устойчивыми. Например, агент-аналитик ставит ТЗ по человеческому запросу агенту-програмисту, а агент-тестировщик пишет тесты, агент-аналитик смотрит наскольк они соответствуют ТЗ. То есть неустойчивость одного агента компенсируется работой других. Теория вероятностей говорит, что ошибка станет намного менее вероятной.
Здравствуйте, dsorokin, Вы писали:
D>Я правильно понимаю суть этих ИИ-агентов, или ошибаюсь? ИИ-агенты обладают свойством детерминированности? Или их результат работы зависит, скажем, от фазы луны? И это не фигура речи. Мне действительно интересно. Есть детерминизм или нет? Это фундаментальное свойство систем программирования, если что.
Ещё хотел добавить, что их научили пользоваться различными тулзами: поиск, калькулятор, логический движок для доказательства теорем, интерпретатор Питона и т.д. То есть работа агентов — это уже не только плод их размышлений, но и какие-то факты, которым можно доверять в бОльшей степени. Что сильно снижает поле для галлюцинаций.
Здравствуйте, Nuzhny, Вы писали:
N>Ещё хотел добавить, что их научили пользоваться различными тулзами: поиск, калькулятор, логический движок для доказательства теорем, интерпретатор Питона и т.д. То есть работа агентов — это уже не только плод их размышлений, но и какие-то факты, которым можно доверять в бОльшей степени. Что сильно снижает поле для галлюцинаций.
Ну, вообще, это все интересно, конечно. В общем случае (когда язык разговорный) — задача нерешаемая, а вот какие-нибудь диалекты для постановки задач — почему бы и нет? Получается такая смесь DSL + человеческий язык. Но все равно, уверенности нет, что компьютер все правильно понял.
И кстати, я до сих пор предпочитаю, что, звоня в условный Газпром или Ростелеком, то на другом конце отвечает именно человек, а не робот.
Мне кажется, что потом появятся статьи о том, вот там ИИ написал программу, а в ней оказались фатальные ошибки, которые на что-то серьезное повлияли. Я понимаю, что это не остановит людей от экспериментов. Буквально, процентов 15 всех людей обладают таким духом экспериментаторства, что их, вообще, ничего не остановит, и это как раз самые творческие люди. Вопрос в том, куда заведут эти эксперименты с ИИ? Сомневаюсь, что в светлое будущее.
Здравствуйте, Nuzhny, Вы писали:
N>Перевод статьи на русский. N>Оригинал платный, с ним так просто не ознакомиться.
N>Cursor — это IDE, форк VS Code, который по задумке авторов должен работать сильно иначе, а именно использовать всю мощь ИИ-агентов, которые запускаются в облаке.
Зачем он нужен, когда есть VS Code и Copilot?
Тут на одном форуме начали обсуждать подобную тему, и пока никто не смог сказать почему курсор.
Здравствуйте, Enomay, Вы писали:
E>Зачем он нужен, когда есть VS Code и Copilot?
Я с Курсором не работал, по словам коллег, он более глобальный, лучше ориентируется в коде всего проекта, лучше понимает контекст и ближе к самостоятельному разработчику. Копилот же ближе к очень продвинутому генератору кода. Можно почитать обзоры.
Здравствуйте, Nuzhny, Вы писали:
N>Здравствуйте, Enomay, Вы писали:
E>>Зачем он нужен, когда есть VS Code и Copilot?
N>Я с Курсором не работал, по словам коллег, он более глобальный, лучше ориентируется в коде всего проекта, лучше понимает контекст и ближе к самостоятельному разработчику. Копилот же ближе к очень продвинутому генератору кода. Можно почитать обзоры.
Копилот умеет делать всё то же самое. Но еще и в разных IDE.
Здравствуйте, dsorokin, Вы писали:
D>Как вот тогда доверять таким "программам"? Тут, вон компиляторы C++ иногда не могут договориться между собой в том, как трактовать код (разные парсеры, немного отличается семантика), а тут — человеческий язык.
Расскажу как.
1) я в диалоговом режиме с LLM генерирую на последнем некоторый код. Первый раз — большой промт размером не меньше страницы, где по пунктам сформулировано что мне нужно. Смотрю бегло вывод, если нравится — прошу дополнить тем, сем и вот этим.
2) Когда получаю вариант который меня более менее устраивает — прошу к нему сгенерировать юнит тесты. просматриваю список тестов, прошу дополнить тем, этим и вот этим.
3) отлаживаю тест. Тут же отлаживается и код из пункта 1.
Получаю готовое, протестированное решение.
Проблемы тут две.
1) когнитивная нагрузка — реально выше чем при реализации своими силами. Когда реализуешь идею — начинаешь работать в потоке, не напрягаясь. тут же приходится постоянно вчитываться и анализировать чужой код. А т.к. код выдается очень быстро — на отдых считай нет времени.
2) Сложно сегментировать большую задачу на подзадачи так, чтобы все это кусками скормить LLM.
Ну и самый весомый плюс — производительность сильно повышается. Прям раза в 4 наверное от твоей обычной скорости.
Здравствуйте, Enomay, Вы писали:
E>Копилот умеет делать всё то же самое. Но еще и в разных IDE.
Тут вопрос с какой моделью. Учитывая, что в этом плане у нас за неделю номые модели может выпустить пяток компаний, всё может перевернуться с ног на голову. В перспективе, преимуществ по качеству и функционалу не будет ни у кого, основные ограничения станут финансовыми — кто какую нейронку сможет себе позволить и на сколько запросов.
Что до популярности Cursor, насколько понимаю, агента в Copilot только завезли недавно, поэтому не все могли с ним поработать. И статья на хабре, и комментарии к ней подтверждают, что, условно, полгода назад Cursor был заметно лучше. Так ли это сейчас — хз.
P.S. На реддите пишут, что Курсор сильно быстрее и отзывчивее. Тоже аргумент.
Здравствуйте, Nuzhny, Вы писали:
E>>Копилот умеет делать всё то же самое. Но еще и в разных IDE.
N>Тут вопрос с какой моделью. Учитывая, что в этом плане у нас за неделю номые модели может выпустить пяток компаний, всё может перевернуться с ног на голову. В перспективе, преимуществ по качеству и функционалу не будет ни у кого, основные ограничения станут финансовыми — кто какую нейронку сможет себе позволить и на сколько запросов. N>Что до популярности Cursor, насколько понимаю, агента в Copilot только завезли недавно, поэтому не все могли с ним поработать. И статья на хабре, и комментарии к ней подтверждают, что, условно, полгода назад Cursor был заметно лучше. Так ли это сейчас — хз.
Я вообще тоже за copilot, особых преимуществ у cursor не видно IMHO, должен остаться только один, IMHO курсору мелкомягких не победить, задавят массовостью или ценой
Агента в copilot завезли осенью прошлого года (с тех пор заметно улучшили, да). Модель выбирается. В смысле, можно в том числе подключить свою, в т.ч. локальную.
В подписку на copilot ($10) входят основные модели типа GPT4.1 без ограничений, и лимитированный пакет на более продвинутые.
Здравствуйте, Nuzhny, Вы писали:
N>Здравствуйте, Enomay, Вы писали:
E>>Копилот умеет делать всё то же самое. Но еще и в разных IDE.
N>Тут вопрос с какой моделью.
Copilot позволяет те же самые модели использовать.
N>агента в Copilot только завезли недавно,
Здравствуйте, Enomay, Вы писали:
E>Copilot позволяет те же самые модели использовать. E>Уже с пол года как.
Тогда надо брать один код, давать одинаковые задания и смотреть, кто и как выдаёт. Пока, что можно понять из форумов, Копилот тормознее.
Ну и одна и та же модель совсем не гарантирует ни одинакового качества, ни скорости. Я так понимаю, что внутри у Курсора что-то типа RAG, от качества его построения тоже многое зависит. Понятно, что меняется всё на серверной стороне и регулярно, так что преимущества платформ не очевидны
У меня оно есть. Личное мнение:
a) Тормознутое говно в editor mode (по сравнению с тем же copilot или windsurf).
b) Глюкавое говно в agent mode. После продолжительной борьбы с промптом иногда получить нечто удобоваримое, но оно того не стоит.
Здравствуйте, Enomay, Вы писали:
E>Зачем он нужен, когда есть VS Code и Copilot?
Это на данный момент единственная продакшен платформа с agent mode, хотя над этим работает много кто. agent mode это то что позволяет глобальные многофайловые изменения.
Здравствуйте, bnk, Вы писали:
bnk>В подписку на copilot ($10) входят основные модели типа GPT4.1 без ограничений, и лимитированный пакет на более продвинутые.
Подожди. Бизнес подписка на копилот не 10 долларов. Если ты готов отдать закрытый код сторонней LLM для тренировки- тогда вперёд на 10USD Может, ты ещё и репки все раскроешь в публичный доступ и ключи от квартиры?
Здравствуйте, Артём, Вы писали:
bnk>>В подписку на copilot ($10) входят основные модели типа GPT4.1 без ограничений, и лимитированный пакет на более продвинутые.
Аё>Подожди. Бизнес подписка на копилот не 10 долларов.
Я не увидел для себя никаких значимых преимуществ Business (20) vs Individual (10). Мне доступ ни к какой к enterprise data или настройка безопасности для работников не нужны, я ИП.
А набор моделей и лимит включенных токенов там одинаковые. В этом месяце когда начал использовать Claude 4 (как по мне так единственная реально работающая), почти все токены улетели к сожалению.
Следующий план (Pro+) это $40 в месяц, но можно просто платить за потребление отдельно.
Аё>Если ты готов отдать закрытый код сторонней LLM для тренировки- тогда вперёд на 10USD
GitHub не использует код из приватных репозиториев для обучения, независимо от наличия подписки или ее типа (прописано в Privacy Policy и отображено в настройках)