Après plusieurs jours d'utilisation intensive de GPT-5 via Cursor et via le modèle GPT-5 Pro dans l'application web, je maintiens tout ce que j'ai dit sur le fait que c'est un modèle beaucoup plus intelligent et meilleur en codage que l'Opus 4.1. J'aime toujours Opus et je trouve que l'ergonomie de Claude Code est plus agréable à bien des égards, mais si vous essayez de faire des choses vraiment difficiles qui nécessitent une réflexion vraiment intelligente basée sur des principes fondamentaux et des compétences en informatique, GPT-5 est d'un niveau supérieur. Mais je soupçonne que cela n'émerge que lorsque le mode d'effort de raisonnement est réglé sur au moins moyen, et se manifeste vraiment avec le réglage d'effort élevé. Un bon exemple de problème est la préparation des "redlines" de deux longs et complexes documents juridiques. Pas différentes versions du même document, mais deux documents différents qui proviennent d'un modèle général partagé. C'est un problème très, très difficile à bien résoudre, et cela nécessite de nombreuses astuces et heuristiques intelligentes pour donner des performances et une qualité de sortie décentes (je parle ici d'utiliser des techniques de programmation traditionnelles, pas d'utiliser des LLMs pour faire cette comparaison). GPT-5 avec l'agent Cursor peut simplement proposer plus d'idées, meilleures, plus intelligentes (mais pragmatiques) plus rapidement, et les mettre en œuvre correctement et sans trop de guidance, par rapport à l'Opus 4.1. Cela dépend de ce sur quoi vous travaillez, cependant. Je pense toujours que je préfère le code frontend en NextJS par Opus, par exemple. Mais vous devriez absolument vérifier par vous-même sur vos propres problèmes réels et ne pas faire confiance à toutes les nombreuses personnes disant que le modèle est nul et que c'est la preuve que nous avons atteint un mur. Soit ils utilisent la mauvaise version gratuite sans réfléchir, soit ils n'ont aucune idée de comment formuler des requêtes efficacement, soit ils laissent leurs sentiments envers OpenAI et Altman influencer leurs opinions.
35,63K