Site icon vgolos.org

Майбутнє хмарної інфраструктури та ШІ

680f470e776ce.webp

Швидкі темпи розвитку штучного інтелекту (ШІ) створюють ненажерливий попит на хмарні обчислення та зберігання, оскільки компанії прагнуть обробляти величезні навчальні набори даних, отримати високопродуктивну потужність для виконання робочих навантажень, а також масштабувати ШІ відповідно до потреб бізнесу. Очікується, що сегмент публічної хмарної інфраструктури як послуги (IaaS) зросте на 24,5% у 2025 році.

Гіпермасштабувальники надають розширені можливості ШІ, а постачальники створюють рішення на основі гіпермасштабованих платформ. Підприємства використовують великі мовні моделі (LLM) і малі доменно-орієнтовані моделі, щоб забезпечити різноманітні варіанти використання, від розширення можливостей співробітників за допомогою рольових чат-ботів до надання інтелектуальних даних і створення агентних систем ШІ. Керівники C-suite бачать у майбутньому нові бізнес-моделі на базі штучного інтелекту для надання високоперсоналізованих продуктів і послуг і постійної оптимізації операцій.

Нещодавно компанія Device42 оприлюднила своє бачення «Майбутнє хмарної інфраструктури та штучного інтелекту».

Штучний інтелект має широкий вплив, що відображається в організаційних витратах. Компанії купують не лише послуги на базі графічного процесора (GPU) для сценаріїв використання та додатків, але також використовують мережеві обчислення та різноманітні технології та архітектури зберігання. Як наслідок, штучний інтелект «чинить глибокий вплив на економіку, інфраструктуру, моделі безпеки та типи послуг, які клієнти розгортають у хмарі.

Використання Cloud Rebalancing для оптимізації ціни та продуктивності  

Підприємства зазвичай платять за послуги з одним клієнтом із базою даних і екземплярами EC2. Однак висока вартість послуг штучного інтелекту та графічного процесора спонукає компанії шукати багатокористувальницькі рішення для роботи додатків штучного інтелекту та репатріювати деякі хмарні робочі навантаження в колокацію або локальні центри обробки даних. У звіті IDC у червні 2024 року було виявлено, що 80% респондентів очікують, що протягом наступних 12 місяців будуть певним чином балансувати навантаження на обчислення та сховище.

У Device42 спостерігають збільшення кількості розгортань гібридної хмари, де компанії поєднують розгортання гіпермасштабувальника на основі GPU з площинами керування в публічній хмарі та площинами даних у приватних хмарах.

Однак одна з речей, яку тут помітили, полягає в тому, що зараз ця тенденція рухається трохи в протилежному напрямку. Можливо, це пов’язано з тим, що графічні процесори та інфраструктура, необхідна для живлення штучного інтелекту, дуже дорогі. І структура маржі деяких із цих хмарних сервісів не працює для лідерства в цих ІТ-організаціях. Другим фактором, який обумовлює цю потребу в локальному розгортанні та гібридному хмарному підході, є сховище. Керівникам потрібен великий обсяг сховища, суверенітет і безпеку даних. І вартість зберігання з часом у хмарному середовищі стає складною.

Як ШІ оптимізує продуктивність та інновації в хмарі

ШІ має три основні впливи на впровадження хмари.

Програми AI, які покращують функціональність і безпеку хмари

У Device42 назвали інструменти на основі ШІ, які дозволяють інженерам створювати нові програми. Це:

Ці інструменти та інші агенти безпеки та хмари спрощують розробникам та інженерам DevOps розгортання інфраструктури та додатків у масштабі для підтримки своїх користувачів і клієнтської бази.

Крім розробки коду, агенти можуть автоматизувати виправлення, оновлення та розгортання конвеєра. Однак ці інструменти потребують нагляду, оскільки без нього можуть негативно вплинути на угоди про рівень обслуговування.

Якщо ваше SLA дорівнює чотирьом дев’яткам, навіть 0,5% помилки може знизити ваш рівень обслуговування. Однак, якщо вас влаштовує 1% відсотка відмов, ви можете використовувати його як послугу для підвищення продуктивності, де процес автоматизований, але рішення приймає людина.

Amazon використовував свого помічника Amazon Q GenAI для розробки програмного забезпечення, щоб автоматизувати оновлення Java. У результаті час на оновлення Java різко скоротився з 50 днів розробника до кількох годин, що дозволило Amazon оновити понад 50% своїх робочих систем Java до сучасних систем Java з меншими витратами часу та коштів. Крім того, розробники Amazon могли відправляти 79% автоматично згенерованих оглядів коду без внесення змін.

Використання ШІ для управління ресурсами

Використання штучного інтелекту для управління ресурсами — це палиця з двома кінцями. Штучний інтелект сприятиме ефективному використанню ІТ-інфраструктури, ІТ-ресурсів і хмарних ресурсів для додатків, які не потребують ШІ, але потреба ШІ збільшить використання інфраструктури за допомогою дорогих ресурсів на базі GPU.

Підприємства використовують різні моделі від різних постачальників для досягнення цільових показників ефективності та ціни, що ускладнює автоматизацію цих процесів. Використання керованих послуг через такі компанії, як OpenAI і Anthropic, є простим, оскільки компанії відповідають за базові обчислювальні кластери. Однак не кожна компанія хоче, щоб третя сторона розміщувала їхні конфіденційні дані.

Інший підхід полягає в розміщенні моделей за допомогою LLaMA. Однак за такого підходу компанії повинні купувати своє обладнання та керувати ним, включаючи пошук графічних процесорів, які важко отримати. Підприємствам, можливо, доведеться придбати зарезервовані екземпляри та зарезервувати потужність GPU, щоб отримати доступ до них. Вони також повинні зберігати великі набори даних у хмарному середовищі, яке забезпечує доступ до даних із низькою затримкою для навчання моделі. Типові рішення для зберігання, такі як S3, AWS або сховище blob в Oracle, не працюють, оскільки вони недостатньо швидкі.

Після бурхливих днів експериментів з GenAI, компанії ретельно вивчають прогнозовану рентабельність інвестицій для нових ініціатив. Вони хочуть переконатися, що нове підвищення ефективності додатків на основі штучного інтелекту варте своєї ціни.

Поширені проблеми з хмарною безпекою та керуванням даними

Компанії стикаються з підвищеним суверенітетом даних, конфіденційністю та проблемами безпеки, оскільки вони прагнуть впроваджувати інновації та створювати найкращі моделі, розширюючи можливості ШІ. GPT можуть отримувати та надавати конфіденційні дані користувачам, обходячи традиційні огорожі безпеки та створюючи порушення відповідності.

Інженери з машинного навчання часто не розуміють масштабів проблеми, тому що вони кажуть, що моделі — це масив чисел з плаваючою комою. Однак ці значення призводять до маркерів, які зіставляються з векторними базами даних, що містять конфіденційну інформацію. Крім того, моделі більше не просто прогнозують результати на основі історичних даних. Вони постійно навчаються й розвиваються, а також застосовуються в інших сферах бізнесу. Компанії, які не змінюють свої моделі безпеки та загроз, ризикують розкрити важливу інтелектуальну власність.

У результаті компанії застосовують наскрізне управління даними, гарантуючи, що вони забезпечують походження, класифікацію, суверенітет і відповідність, забезпечуючи при цьому якість і цілісність. Це означає, що потрібно врахувати, звідки надходять навчальні дані, як вони використовуються для точного налаштування моделей, їх структура управління та оренди, а також де зберігаються та використовуються векторні бази даних.

Вибір правильних технологічних партнерів для адаптації та успіху ШІ

Отже, з ким мають працювати підприємства?

Лідерам спокусливо вибрати такі компанії, як AWS, тому що вони мають велику частку ринку, провести хакатон, а потім оголосити про співпрацю для вирішення своїх проблем. Це трапляється багато разів, і це помилка. Це тому, що в стартапах багато інновацій. Наприклад, на ринку представлено понад 100 базових моделей, які пропонують вибір, крім ChatGPT від OpenAI, Claude від Anthropic і DeepSeek AI.

Яку мажна дати пораду щодо вибору постачальників?

Створіть чіткий механізм політики для прийняття рішення про використання конкретних моделей для різних типів даних і забезпечення їх дотримання.

Нехай ваші розробники виберуть моделі, які, на їхню думку, будуть найбільш успішними для їхніх додатків у межах цих рамок.

Оцініть досвід роботи з новими програмами штучного інтелекту, вимірявши показники чистих промоутерів та інші показники, щоб побачити, які моделі добре працюють у різних середовищах.

Не вибирайте одного партнера. Ви заплатите за це ціну. Витрати на підтримку багатьох різних моделей і партнерів набагато дешевші, ніж вибір одного партнера і втрата інновацій і можливостей, які зможуть запропонувати конкуренти.

Успішна інтеграція ШІ в хмарні операції

Отже, як ШІ покращує хмарні операції? Згадаємо використання ШІ для виявлення програм розподіленої відмови в обслуговуванні (DDoS) у середовищах безпеки. DDoS — це надзвичайно складна проблема для вирішення, оскільки у вас є трафік, що надходить з усього світу — усілякі IP-адреси та вихідні мережі. Ви намагаєтесь заблокувати нелегітимний трафік від зловмисника, дозволяючи проходити легітимному трафіку клієнтів.

Такі компанії, як Cloudflare, AWS і Azure, тепер використовують моделі GenAI, які працюють із журналами веб-трафіку, щоб виявляти, коли трафік надходить із джерела DDoS-атаки, а потім автоматично блокувати його. Ці моделі дуже добре виявляють автоматизований трафік проти людського трафіку.

Іншими прикладами є автоматичне сканування журналу для визначення збоїв і автоматичне створення конвеєра. Проте не було ще прикладів, коли агенти штучного інтелекту замінюють людей, і важко очікувати, що це станеться, доки рівень помилок не стане меншим за 0,1%, 1% або 0,0001%, залежно від вимог програми.

Прогнози щодо того, як хмара та ШІ розвиватимуться протягом наступного десятиліття

Зниження вартості зробить штучний інтелект доступнішим: можна очікувати, що кількість графічних процесорів, необхідних для просунутих моделей, скоротиться протягом п’яти років, а паралельні матриці, що використовуються для живлення моделей GenAI, – протягом 10 років. Це стане товарним засобом, де запуск моделей штучного інтелекту коштуватиме копійки за годину.

Для обробки — від хмари до краю й назад: хоча сьогодні підприємства часто обирають периферійну обробку для моделей штучного інтелекту, у майбутньому повсюдне поширення оптоволокна, високі швидкості 5G і падіння вартості пропускної здатності зроблять хмарну обробку кращим вибором для всіх моделей, за винятком тих, які надзвичайно чутливі до затримок або мають вимоги до фізичної безпеки.

Агенти штучного інтелекту не замінять людей у ​​великому масштабі: Важко вірити, що моделі штучного інтелекту повсюдно замінять працівників через проблеми відповідальності бізнесу. Якщо модель зазнає невдачі, хто візьме на себе відповідальність? Це вина розробника бота, незалежного постачальника програмного забезпечення, який використовував бота, чи підприємства, яке розміщує програму з ботом? Зрештою, вам потрібна підзвітність. Хтось має володіти проблемою. І хоча боти добре реагують, вони не вміють володіти речами. Це головний недолік штучного інтелекту.

Як ШІ вплине на багатохмарні та гібридні хмарні стратегії підприємств

Проблеми з доступністю GPU, а також витрати на обчислення та модель ШІ змусили підприємства прийняти гібридні та багатохмарні стратегії. Цей підхід сприятиме стандартизації основних API, які забезпечують роботу хмарних служб.

Хмара перетворюється на операційну систему для розподілених програм і ви не можете мати три API для відкриття файлу. Потрібна стандартна бібліотека. Terraform намагається це зробити, але існує чотири різні версії Terraform для розгортання додатків. Ми побачимо певну стандартизацію, оскільки графічні процесори необхідні в усіх цих середовищах.

Рекомендації щодо узгодження хмарних стратегій із впровадженням ШІ

Можна запропонувати рекомендації щодо узгодження стратегій хмари та ШІ:

Розуміння економічної цінності інвестицій. Чи справді ви заощаджуєте гроші, тому що готівка — це цар? Це особливо вірно в середовищах, де інфляція, нестабільний попит споживачів і політика уряду, що швидко змінюється, створюють невпевненість на ринку та лідерах.

Мати реалістичні очікування щодо автоматизації. Автоматизація — це головний напрямок для лідерів, але вони повинні перевірити кожне припущення фінансової моделі, яка керує їхньою цільовою програмою. Наприклад використання штучного інтелекту для перегляду тисяч рахунків, щоб визначити можливості економії. В якості першого кроку компанії повинні переконатися, що моделі можуть правильно читати рахунки та оцінювати структури даних, перш ніж тестувати інші припущення. Ми часто думаємо, що програмне забезпечення є узгодженим. Однак штучний інтелект не є узгодженим програмним забезпеченням. Отже, ви повинні перевірити свої припущення, перш ніж ви зможете передбачити економію коштів або дохід, який ви отримаєте, використовуючи штучний інтелект у своїх бізнес-операціях.

Про Device42

Device42 — це комплексна платформа для управління ІТ-інфраструктурою, яка спеціалізується на виявленні, управлінні активами та картографуванні залежностей у гібридних ІТ-середовищах, включаючи дата-центри та хмарні платформи.

Основні можливості:

В Україні постачальником рішень Device42 є компанія Ідеалсофт.

Exit mobile version