Как устроен Cursor - Компьютерные священные войны

Перевод статьи на русский.
Оригинал платный, с ним так просто не ознакомиться.

Добавка: перевод второй части.
Cursor — это IDE, форк VS Code, который по задумке авторов должен работать сильно иначе, а именно использовать всю мощь ИИ-агентов, которые запускаются в облаке.

Из интересного — он очень популярен:

Стартап, стоящий за Cursor — Anysphere, был основан в 2022 году, а в марте 2023 года запустил Cursor. Недавно Anysphere сообщила, что привлекла $900 млн, при оценке компании в $9.9B. Годовой доход уже превысил $500M. Ни одна другая компания в сфере инструментов для разработчиков, которую я знаю, не достигала этого рубежа в течение первых 2 лет после запуска первого продукта. Поспособствовало этому и то, что Cursor используется более чем половиной из 500 крупнейших технологических компаний из списка Fortune 500.

Знакомые из стран, где его можно легко использовать, кайфуют, правда нравится.

Технологический стек. TypeScript, Rust и куча облачных провайдеров — Turbopuffer, Datadog, PagerDuty и другие.

TypeScript — это потому что VS Code изначально на нём написан, Rust — это для производительности.

Статья не сильно большая, продолжение (вторая часть) следует, проект очень свежий, много про технологии. Короче, мне было интересно почитать.

Здравствуйте, Nuzhny, Вы писали:

N>Cursor — это IDE, форк VS Code, который по задумке авторов должен работать сильно иначе, а именно использовать всю мощь ИИ-агентов, которые запускаются в облаке.

Так это может закончиться тем, что языком программирования станет некоторое подмножество разговорного человеческого языка, но это неточно. Будет такой "COBOL Ultra Plus AI". Кто видел кобол хотя бы издалека — те меня могут понять.

А если серьезно, то в человеческом языке много противоречий и неоднозначностей, много смыслов, много прочтений. Даже мы, люди, по-разному понимаем одни и те же слова, по-разному воспринимаем одни и те же фильмы, по-разному воспринимаем одних и тех же людей — и это нормально (см. "архетипы" в юнгианстве).

Как вот тогда доверять таким "программам"? Тут, вон компиляторы C++ иногда не могут договориться между собой в том, как трактовать код (разные парсеры, немного отличается семантика), а тут — человеческий язык.

Я правильно понимаю суть этих ИИ-агентов, или ошибаюсь? ИИ-агенты обладают свойством детерминированности? Или их результат работы зависит, скажем, от фазы луны? И это не фигура речи. Мне действительно интересно. Есть детерминизм или нет? Это фундаментальное свойство систем программирования, если что.

Просто я почти не соприкасался с этим ИИ. Что я увидел — сделало меня скептиком после мимолетного вау-эффекта. Вау-эффект был — каюсь. И забавно наблюдать со стороны на весь этот масштабный движ в узких кругах программистов на фоне того, что происходит в мире более глобального и значимого

Здравствуйте, dsorokin, Вы писали:

D>Я правильно понимаю суть этих ИИ-агентов, или ошибаюсь? ИИ-агенты обладают свойством детерминированности? Или их результат работы зависит, скажем, от фазы луны? И это не фигура речи. Мне действительно интересно. Есть детерминизм или нет? Это фундаментальное свойство систем программирования, если что.

1. Детерменированность — может быть, а может и не быть. За это отвечает особый параметр, который называют температурой. Можно их запускать с такой настройкой, при которой они будут максимально детерменированы и на одни и те же входные данные выдавать один и тот же ответ. А можно повышать температуру и ответы будут разными. Грубо говоря, нейросеть учится предсказывать следующий токен (можно принять, что токен — это слово), при предсказании будет N вариантов, каждый со своей вероятностью. При нулевой температуре выбирается наиболее вероятное словое, а чем выше температура, тем больше вероятности взять менее вероятное слово.

2. Я думаю, что тебя больше волнует не детерменированность, а устойчивость, а именно, насколько сильно влияет на ответ небольшое изменение входных данных. Вот с этим уже похуже в общем случае. Тут приводили примеры, как эмоциональный окрас вопроса может влиять на качество ответа.

3. Ещё более важно, как ведут себя нейросети с математикой и программированием. Насколько я понимаю, в этих областях они намного, намного лучше гуманитарных за счёт того, что при обучении есть точные ответы. Также уже научились обучать не просто на точных ответах, но и на промежуточных рассуждениях, что ещё намного круче.

4. Ещё важный момент — доверие к тому, что выдаёт модель. Тут увеличили точность, во-первых, с помощью рассуждений, и, во-вторых, агентные системы — это не одна большая нейросеть, а множество нейросетей со своей специализацией. Это может быть и одна нейросеть, но с разными инстансами и разными промтами для каждого. Это делает ответы более устойчивыми. Например, агент-аналитик ставит ТЗ по человеческому запросу агенту-програмисту, а агент-тестировщик пишет тесты, агент-аналитик смотрит наскольк они соответствуют ТЗ. То есть неустойчивость одного агента компенсируется работой других. Теория вероятностей говорит, что ошибка станет намного менее вероятной.

Здравствуйте, Nuzhny, Вы писали:

N>Ещё хотел добавить, что их научили пользоваться различными тулзами: поиск, калькулятор, логический движок для доказательства теорем, интерпретатор Питона и т.д. То есть работа агентов — это уже не только плод их размышлений, но и какие-то факты, которым можно доверять в бОльшей степени. Что сильно снижает поле для галлюцинаций.

Ну, вообще, это все интересно, конечно. В общем случае (когда язык разговорный) — задача нерешаемая, а вот какие-нибудь диалекты для постановки задач — почему бы и нет? Получается такая смесь DSL + человеческий язык. Но все равно, уверенности нет, что компьютер все правильно понял.

И кстати, я до сих пор предпочитаю, что, звоня в условный Газпром или Ростелеком, то на другом конце отвечает именно человек, а не робот.

Мне кажется, что потом появятся статьи о том, вот там ИИ написал программу, а в ней оказались фатальные ошибки, которые на что-то серьезное повлияли. Я понимаю, что это не остановит людей от экспериментов. Буквально, процентов 15 всех людей обладают таким духом экспериментаторства, что их, вообще, ничего не остановит, и это как раз самые творческие люди. Вопрос в том, куда заведут эти эксперименты с ИИ? Сомневаюсь, что в светлое будущее.

Здравствуйте, Nuzhny, Вы писали:

N>Перевод статьи на русский.
N>Оригинал платный, с ним так просто не ознакомиться.

N>Cursor — это IDE, форк VS Code, который по задумке авторов должен работать сильно иначе, а именно использовать всю мощь ИИ-агентов, которые запускаются в облаке.

Зачем он нужен, когда есть VS Code и Copilot?

Тут на одном форуме начали обсуждать подобную тему, и пока никто не смог сказать почему курсор.

Здравствуйте, Enomay, Вы писали:

E>Зачем он нужен, когда есть VS Code и Copilot?

Я с Курсором не работал, по словам коллег, он более глобальный, лучше ориентируется в коде всего проекта, лучше понимает контекст и ближе к самостоятельному разработчику. Копилот же ближе к очень продвинутому генератору кода. Можно почитать обзоры.

Здравствуйте, Nuzhny, Вы писали:

N>Здравствуйте, Enomay, Вы писали:

E>>Зачем он нужен, когда есть VS Code и Copilot?

N>Я с Курсором не работал, по словам коллег, он более глобальный, лучше ориентируется в коде всего проекта, лучше понимает контекст и ближе к самостоятельному разработчику. Копилот же ближе к очень продвинутому генератору кода. Можно почитать обзоры.

Копилот умеет делать всё то же самое. Но еще и в разных IDE.

Здравствуйте, dsorokin, Вы писали:

D>Как вот тогда доверять таким "программам"? Тут, вон компиляторы C++ иногда не могут договориться между собой в том, как трактовать код (разные парсеры, немного отличается семантика), а тут — человеческий язык.

Расскажу как.
1) я в диалоговом режиме с LLM генерирую на последнем некоторый код. Первый раз — большой промт размером не меньше страницы, где по пунктам сформулировано что мне нужно. Смотрю бегло вывод, если нравится — прошу дополнить тем, сем и вот этим.
2) Когда получаю вариант который меня более менее устраивает — прошу к нему сгенерировать юнит тесты. просматриваю список тестов, прошу дополнить тем, этим и вот этим.
3) отлаживаю тест. Тут же отлаживается и код из пункта 1.

Получаю готовое, протестированное решение.

Проблемы тут две.
1) когнитивная нагрузка — реально выше чем при реализации своими силами. Когда реализуешь идею — начинаешь работать в потоке, не напрягаясь. тут же приходится постоянно вчитываться и анализировать чужой код. А т.к. код выдается очень быстро — на отдых считай нет времени.
2) Сложно сегментировать большую задачу на подзадачи так, чтобы все это кусками скормить LLM.

Ну и самый весомый плюс — производительность сильно повышается. Прям раза в 4 наверное от твоей обычной скорости.

Здравствуйте, Enomay, Вы писали:

E>Копилот умеет делать всё то же самое. Но еще и в разных IDE.

Тут вопрос с какой моделью. Учитывая, что в этом плане у нас за неделю номые модели может выпустить пяток компаний, всё может перевернуться с ног на голову. В перспективе, преимуществ по качеству и функционалу не будет ни у кого, основные ограничения станут финансовыми — кто какую нейронку сможет себе позволить и на сколько запросов.
Что до популярности Cursor, насколько понимаю, агента в Copilot только завезли недавно, поэтому не все могли с ним поработать. И статья на хабре, и комментарии к ней подтверждают, что, условно, полгода назад Cursor был заметно лучше. Так ли это сейчас — хз.

P.S. На реддите пишут, что Курсор сильно быстрее и отзывчивее. Тоже аргумент.

Здравствуйте, Nuzhny, Вы писали:

E>>Копилот умеет делать всё то же самое. Но еще и в разных IDE.

N>Тут вопрос с какой моделью. Учитывая, что в этом плане у нас за неделю номые модели может выпустить пяток компаний, всё может перевернуться с ног на голову. В перспективе, преимуществ по качеству и функционалу не будет ни у кого, основные ограничения станут финансовыми — кто какую нейронку сможет себе позволить и на сколько запросов.
N>Что до популярности Cursor, насколько понимаю, агента в Copilot только завезли недавно, поэтому не все могли с ним поработать. И статья на хабре, и комментарии к ней подтверждают, что, условно, полгода назад Cursor был заметно лучше. Так ли это сейчас — хз.

Я вообще тоже за copilot, особых преимуществ у cursor не видно IMHO, должен остаться только один, IMHO курсору мелкомягких не победить, задавят массовостью или ценой

Агента в copilot завезли осенью прошлого года (с тех пор заметно улучшили, да). Модель выбирается. В смысле, можно в том числе подключить свою, в т.ч. локальную.
В подписку на copilot ($10) входят основные модели типа GPT4.1 без ограничений, и лимитированный пакет на более продвинутые.

Здравствуйте, Nuzhny, Вы писали:

N>Здравствуйте, Enomay, Вы писали:

E>>Копилот умеет делать всё то же самое. Но еще и в разных IDE.

N>Тут вопрос с какой моделью.

Copilot позволяет те же самые модели использовать.

N>агента в Copilot только завезли недавно,

Уже с пол года как.

Здравствуйте, Enomay, Вы писали:

E>Copilot позволяет те же самые модели использовать.
E>Уже с пол года как.

Тогда надо брать один код, давать одинаковые задания и смотреть, кто и как выдаёт. Пока, что можно понять из форумов, Копилот тормознее.
Ну и одна и та же модель совсем не гарантирует ни одинакового качества, ни скорости. Я так понимаю, что внутри у Курсора что-то типа RAG, от качества его построения тоже многое зависит. Понятно, что меняется всё на серверной стороне и регулярно, так что преимущества платформ не очевидны

Здравствуйте, Nuzhny, Вы писали:

У меня оно есть. Личное мнение:
a) Тормознутое говно в editor mode (по сравнению с тем же copilot или windsurf).
b) Глюкавое говно в agent mode. После продолжительной борьбы с промптом иногда получить нечто удобоваримое, но оно того не стоит.

Здравствуйте, Enomay, Вы писали:

E>Зачем он нужен, когда есть VS Code и Copilot?
Это на данный момент единственная продакшен платформа с agent mode, хотя над этим работает много кто. agent mode это то что позволяет глобальные многофайловые изменения.

Здравствуйте, Nuzhny, Вы писали:

N>TypeScript — это потому что VS Code изначально на нём написан, Rust — это для производительности.

Вызывать агента в облаке — для этого нужен производительный раст, ага. Разница с пэхапе огромная (нет).

ЗЫ я пробовал курсор — в моём случае оно оч тупенькое для поставленной задачи было.

Здравствуйте, Nuzhny, Вы писали:

N>Тогда надо брать один код, давать одинаковые задания и смотреть, кто и как выдаёт.
Qt для QML такое делает

Здравствуйте, bnk, Вы писали:

bnk>В подписку на copilot ($10) входят основные модели типа GPT4.1 без ограничений, и лимитированный пакет на более продвинутые.

Подожди. Бизнес подписка на копилот не 10 долларов. Если ты готов отдать закрытый код сторонней LLM для тренировки- тогда вперёд на 10USD

Может, ты ещё и репки все раскроешь в публичный доступ и ключи от квартиры?

Здравствуйте, Артём, Вы писали:

bnk>>В подписку на copilot ($10) входят основные модели типа GPT4.1 без ограничений, и лимитированный пакет на более продвинутые.

Аё>Подожди. Бизнес подписка на копилот не 10 долларов.

Я не увидел для себя никаких значимых преимуществ Business (20) vs Individual (10). Мне доступ ни к какой к enterprise data или настройка безопасности для работников не нужны, я ИП.
А набор моделей и лимит включенных токенов там одинаковые. В этом месяце когда начал использовать Claude 4 (как по мне так единственная реально работающая), почти все токены улетели к сожалению.
Следующий план (Pro+) это $40 в месяц, но можно просто платить за потребление отдельно.

Аё>Если ты готов отдать закрытый код сторонней LLM для тренировки- тогда вперёд на 10USD

GitHub не использует код из приватных репозиториев для обучения, независимо от наличия подписки или ее типа (прописано в Privacy Policy и отображено в настройках)

От:	Nuzhny	https://github.com/Nuzhny007
Дата:	20.06.25 14:28
Оценка:	12 (5)

	От:	dsorokin
	Дата:	21.06.25 16:50
	Оценка:	+1

От:	Nuzhny	https://github.com/Nuzhny007
Дата:	21.06.25 20:05
Оценка:

От:	Nuzhny	https://github.com/Nuzhny007
Дата:	21.06.25 20:10
Оценка:	2 (2)

	От:	dsorokin
	Дата:	22.06.25 09:19
	Оценка:

От:	bnk	http://unmanagedvisio.com/
Дата:	23.06.25 07:51
Оценка:

	От:	Skorodum
	Дата:	25.06.25 15:21
	Оценка:

От:	Артём	жж
Дата:	28.06.25 22:11
Оценка: