В первой части этой серии мы исследовали экспоненциальный рост мировых данных, который удваивается каждые два года. Имея все эти данные, люди обращаются к искусственному интеллекту (ИИ), чтобы разобраться во всем. Обработка и память должны продолжать улучшаться, но возникают и новые проблемы.

По мере того, как наши выводы на основе данных становятся более ценными, возрастает потребность в усилении безопасности. Не только для защиты данных, но и для моделей ИИ, обучающих данных и инфраструктуры. Неудивительно, что растущая ценность данных и идей побуждает разработчиков ИИ разрабатывать более мощные алгоритмы, более значимые наборы данных и более эффективные методы обеспечения безопасности.

Более быстрые процессоры и память необходимы для обеспечения лучших алгоритмов и топологий, а также для обработки растущих объемов данных. Но на два основных инструмента полупроводниковой промышленности для повышения производительности за последние несколько десятилетий - закон Мура и масштабирование Деннарда - больше нельзя полагаться, как раньше. Закон Мура замедляется, и масштабирование Dennard сломалось примерно в 2005 году. Чтобы продолжать удовлетворять потребности передовых приложений ИИ и экспоненциального роста данных, отрасль вынуждена искать новые способы повышения производительности и энергоэффективности.

В то же время архитектура Интернета неуклонно развивается. Привычная модель облачной обработки, в которой конечные точки собирают данные и передают их в облако для обработки, также меняется. С развертыванием 5G будет больше подключенных устройств и данных, и будет невозможно отправить все это в географически удаленные центры обработки данных.


Сдвиг обработки на край

Поскольку цифровые данные в мире продолжают расширяться быстрее, чем скорость, с которой улучшаются сети, новые возможности обработки будут обнаружены на периферии. Граница включает в себя базовые станции и более географически распределенные точки обработки, которые находятся между облачными центрами обработки данных и конечными точками.

Пограничные центры обработки данных предлагают возможность обрабатывать данные ближе к месту их генерации, обеспечивая обработку с меньшей задержкой для таких приложений, как автономные транспортные средства. А обрабатывая данные на периферии, мы можем отправлять меньший объем более ценных данных в облачные центры обработки данных, снижая потребность в пропускной способности сети. Поступив так, мы увидим большее улучшение производительности и энергоэффективности.

По мере того, как периферийная обработка становится широко распространенной, облако по-прежнему будет важной частью нашей экономики данных и будет по-прежнему использоваться для самых сложных задач. В некоторых случаях данные, захваченные конечными точками, будут отправлены на периферию для начальной обработки перед отправкой в ​​облачные центры обработки данных. В других случаях данные будут поступать прямо в облако, где они могут быть объединены с другими данными, собранными из разных регионов, в один совокупный набор данных.

Расширяющаяся роль ИИ

Мы ожидаем, что ИИ будет развернут в развивающемся Интернете в центрах обработки данных, на периферии и все чаще в конечных точках, хотя требования и приложения для каждого будут разными. Самые сложные задачи, включая обучение и логический вывод для крупнейших нейронных сетей, использующих большие обучающие наборы, останутся в облачных центрах обработки данных. Будут использоваться самые высокопроизводительные аппаратные решения, которые будут подключены к стене для получения максимальной мощности.

Для поддержки этих высокопроизводительных решений искусственного интеллекта потребуются самые высокопроизводительные и энергоэффективные решения для памяти. В этом пространстве будут использоваться как внутренняя память, так и очень высокопроизводительные дискретные решения DRAM, такие как HBM и GDDR. Конечные устройства будут преимущественно питаться от батарей и продолжать использоваться для логических выводов, подобно тому, что мы видим сегодня. Системы памяти для оконечных устройств обычно используют встроенную память или маломощную мобильную память. Сегодня определение границы расширилось и теперь состоит как из ближнего края (ближе к ядру центра обработки данных), так и из дальнего края (ближе к конечным точкам). В будущем мы увидим полный спектр решений для памяти, используемых на периферии.

В ближайшем будущем процессоры и системы памяти будут аналогичны тем, которые мы видим в облаке, с использованием встроенной памяти, HBM и GDDR. По мере перехода к конечным точкам процессоры и память на дальнем конце будут похожи на то, что мы видим в конечных точках, включая встроенную память, LPDDR и DDR. Но мы также ожидаем увидеть некоторые приложения для конечных точек, требующие чрезвычайно высокой производительности, например автономные транспортные средства. Для ИИ в этих устройствах память, такая как GDDR, подходит для удовлетворения потребностей в производительности и энергоэффективности.

Возрождение ИИ произвело революцию в том, как мир хранит, анализирует и передает данные. И между ИИ и цифровыми данными сложилась интересная взаимосвязь. Чтобы сделать ИИ лучше, требуются большие объемы данных, а ИИ во многих случаях является единственным разумным способом разобраться в больших объемах данных. Заглядывая в будущее, можно сказать, что если приложения искусственного интеллекта и дальше будут реализовывать весь свой потенциал, тогда на передний план должны выйти энергоэффективная память с высокой пропускной способностью.