У Box ми витрачаємо багато часу на тестування Box AI з новими моделями на неструктурованих даних, щоб побачити, у чому вони добре працюють у реальних сферах знань. Як ми бачили з тестів, GPT-5 пропонує значний стрибок у можливостях порівняно з GPT-4.1 у міркуваннях, математиці, логіці, кодуванні та інших сферах роботи. Ось кілька прикладів того, як ці вдосконалення вступають у гру в реальному світі: *GPT 5 краще контекстуалізує інформацію. Під час вилучення даних, як-от кінцева сума в доларах США в рахунку-фактурі без валютних міток, але з адресою в Лондоні, GPT 5 правильно відповідає, потребуючи курсу конвертації з USD у GBP. Для порівняння, GPT 4.1 побачив остаточну купюру і повернув її, припустивши валюту (неправильно). * GPT-5 забезпечує кращий мультимодальний аналіз. Для щорічної звітності публічної компанії GPT-5 просять ізолювати клітинку в таблиці від зображення, що показує зміни в компонентах капіталу компанії. Верхня частина таблиці уточнює, що всі суми акцій обчислюються тисячами, і GPT-5 чітко вказує на цю конвертацію, тоді як GPT-4.1 – ні, заплутавшись, враховуючи, що в таблиці написано акції, а в легенді – акції. * GPT-5 працює краще з високим рівнем оперативних повідомлень і складності даних. Виконуючи вилучення даних у резюме для всіх дат початку роботи, назв посад та імен роботодавців, GPT-5 зміг витягнути кожен фрагмент даних, тоді як GPT-4.1, здається, був перевантажений і не витягнув ті самі поля, враховуючи розмір запиту та складність документа. * GPT-5 набагато зрозуміліший і чіткіший у своїх відповідях. У угоді про аутсорсинг з 6 різними службами, яка прямо обговорюється, коли її запитають про «5 конкретних послуг у контракті», GPT-5 поверне перші 5 і запитає, чи було навмисно, що шосту не запитали. Для порівняння, GPT-4.1 просто повернув перші 5 без будь-яких додаткових застережень, що може призвести до подальшої плутанини для користувача. * GPT-5 краще справляється з інтерпретацією даних у складних полях. Для діаграми проточної цитометрії, яка зазвичай використовується в імунології, GPT-5 правильно визначив високу частку мертвих клітин і дав правдоподібні кореневі причини, які могли б призвести до ситуації, тоді як GPT-4.1 дав мінімальне обґрунтування, потребуючи додаткового підтвердження, щоб мати будь-які припущення на основі необроблених даних. * GPT-5 краще виявляє невідповідності в коді. Коли його попросили виявити проблеми в даному файлі коду Python, хоча як GPT-5, так і 4.1 можуть виявити реальні помилки, які призводять до збою, лише GPT-5 зміг зробити висновок про більш тонкі проблеми, як-от друк неправильної змінної, коли це не мало б сенсу в контексті програми. Ці покращення в математиці, міркуванні, логіці та якості відповідей у довших контекстних вікнах неймовірно корисні для кінцевих користувачів у повсякденній роботі, але вони будуть проявлятися ще більше з більш тривалими агентами штучного інтелекту, особливо коли немає людини, яка б перевіряла інформацію на кожному кроці. Чудово бачити, що ці вдосконалення продовжують з'являтися в останньому наборі моделей штучного інтелекту, оскільки це призведе до того, що агенти штучного інтелекту зможуть використовуватися у все більш критично важливих областях роботи.
77,66K