Adapteva является мощностями полупроводниковой компании упор на низкую мощность многих основной микропроцессорной конструкции. Компания была второй компанией, объявившей о разработке с 1000 специализированных процессорных ядер на одной интегральной схеме . [1] [2]
Промышленность | Полупроводниковая промышленность |
---|---|
Основан | Март 2008 г. |
Основатель | Андреас Олофссон |
Штаб-квартира | , нас |
Ключевые люди | Андреас Олофссон, генеральный директор |
Продукты | Центральные процессоры |
Владелец | Частное финансирование |
Веб-сайт | Adapteva |
Adapteva была основана в 2008 году с целью десятикратного увеличения производительности операций с плавающей запятой на ватт на рынке мобильных устройств. Продукты основаны на многоядерной архитектуре с несколькими инструкциями, множеством данных (MIMD) Epiphany и его проекте Parallella Kickstarter, продвигающем в сентябре 2012 года «суперкомпьютер для всех». Название компании представляет собой комбинацию слова «адаптироваться» и еврейского слова «Teva». "имея в виду природу.
История
Adapteva была основана в марте 2008 года Андреасом Олофссоном. Компания была основана с целью 10-кратного повышения энергоэффективности обработки с плавающей запятой на рынке мобильных устройств . В мае 2009 года у Олофссона был прототип нового типа многоядерной компьютерной архитектуры с массовым параллелизмом . Первоначальный прототип был реализован на 65 нм и имел 16 независимых микропроцессорных ядер. Первые прототипы позволили Adapteva получить 1,5 миллиона долларов США в виде финансирования серии А от BittWare, компании из Конкорда, Нью-Гэмпшир , в октябре 2009 года [3].
Первые коммерческие чипы Adapteva начали поступать в продажу в начале мая 2011 года, и вскоре после этого они объявили о возможности разместить до 4096 ядер на одном чипе.
Epiphany III , был объявлен в октябре 2011 года с использованием 28 нм и 65 нм производственных процессов.
Продукты
Основное семейство продуктов Adapteva - это масштабируемая многоядерная архитектура MIMD Epiphany . Архитектура Epiphany может содержать до 4096 микропроцессоров RISC , работающих в неупорядоченном режиме , и все они совместно используют одно 32-битное плоское пространство памяти. Каждый RISC- процессор в архитектуре Epiphany является суперскалярным с 64 × 32-битным микропроцессором унифицированного регистрового файла (целочисленной или одинарной точности ), работающим на частоте до 1 ГГц и способным к 2 GFLOPS (одинарной точности). Процессоры RISC Epiphany используют пользовательский набор инструкций архитектуры (ISA) , оптимизированный для одинарной точности с плавающей точкой , [4] , но могут быть запрограммированы на высоком уровне ANSI C с использованием стандартного GNU-GCC цепи инструмента. Каждый RISC-процессор (в текущих реализациях; не зафиксирован в архитектуре) имеет 32 КБ локальной памяти. Код (возможно, дублированный в каждом ядре) и пространство стека должны находиться в этой локальной памяти ; кроме того (большая часть) временных данных должны уместиться там для полной скорости. Данные также могут быть использованы из локальной памяти других ядер процессора со снижением скорости или из ОЗУ вне кристалла с гораздо большим ухудшением скорости.
В архитектуре памяти не используется явная иерархия аппаратных кэшей , как в процессорах Sony / Toshiba / IBM Cell , но с дополнительным преимуществом поддержки внешних и межъядерных нагрузок и хранилищ (что упрощает перенос программного обеспечения в архитектуру) . Это аппаратная реализация разделенного глобального адресного пространства . [ необходима цитата ]
Это устранило необходимость в сложном оборудовании для согласования кэша , которое накладывает практическое ограничение на количество ядер в традиционной многоядерной системе . Дизайн позволяет программисту использовать более глубокие знания о независимых шаблонах доступа к данным, чтобы избежать затрат времени выполнения на выяснение этого. Все узлы процессора связаны через сеть на кристалле , что обеспечивает эффективную передачу сообщений. [5]
Масштабируемость
Архитектура предназначена для практически неограниченного масштабирования, с 4 электронными ссылками, позволяющими объединить несколько микросхем в топологию сетки, что позволяет создавать системы с тысячами ядер.
Многоядерные сопроцессоры
19 августа 2012 года Адаптева опубликовала некоторые спецификации и информацию о многоядерных сопроцессорах Epiphany. [6]
Техническая информация для | E16G301 [7] | E64G401 [8] |
---|---|---|
Ядра | 16 | 64 |
Ядро МГц | 1000 | 800 |
Core GFLOPS | 2 | 1.6 |
«Сумма ГГц» | 16 | 51,2 |
Сумма GFLOPS | 32 | 102 |
мм² | 8,96 | 8,2 |
нм | 65 | 28 год |
W def. | 0,9 | 1.4 |
Вт макс. | 2 | 2 |
В сентябре 2012 года была выпущена 16-ядерная версия Epiphany-III (E16G301) с использованием 65-нм [9] (11,5 мм 2 , 500 МГц чип [10] ) и инженерных образцов 64-ядерного Epiphany-IV (E64G401 ) были получены с использованием процесса 28 нм GlobalFoundries (800 МГц). [11]
Основные рынки многоядерной архитектуры Epiphany включают:
- Смартфон приложения , такие как в режиме реального времени распознавание лиц , распознавание речи , перевод и дополненная реальность .
- Суперкомпьютеры следующего поколения, требующие значительно более высокой энергоэффективности, чтобы позволить системам масштабироваться до экзафлопсного вычислительного уровня.
- Ускорение с плавающей точкой во встроенных системах на основе архитектуры программируемых вентильных матриц .
Параллельный проект
В сентябре 2012 года Адаптева запустила на Kickstarter проект Parallella , который продавался как « Суперкомпьютер для всех ». Справочные руководства по архитектуре платформы были опубликованы в рамках кампании по привлечению внимания к проекту. [12] Цель финансирования в размере 750 000 долларов США была достигнута за месяц, при этом минимальный взнос в размере 99 долларов США дает спонсорам право на получение одного устройства; хотя первоначальный крайний срок был установлен на май 2013 года, первые одноплатные компьютеры с 16-ядерным чипом Epiphany были наконец отгружены в декабре 2013 года [13].
Планируемый размер платы составляет 86 мм × 53 мм (3,4 дюйма × 2,1 дюйма). [14] [15] [16]
Кампания Kickstarter собрала 898 921 доллар США. [17] [18] Собрать 3 миллиона долларов США не удалось, поэтому серийное производство 64-ядерной версии Parallella производиться не будет. [19] Пользователи Kickstarter, пожертвовавшие более 750 долларов США, получат вариант «параллеллы-64» с 64-ядерным сопроцессором (сделанный из первоначального изготовления прототипа с выходом 50 чипов на пластину). [20]
Микросервер Parallella-16 | Настольный компьютер Parallella-16 | Встроенная платформа Parallella-16 | |
---|---|---|---|
Применение | Безголовый сервер, подключенный к сети Ethernet | Персональный компьютер | Передовые встраиваемые системы |
Процессор | Двухъядерный 32-битный ARM Cortex-A9 с NEON на частоте 1 ГГц (часть Zynq чипа Z7010 по Xilinx) | Двухъядерный 32-битный ARM Cortex-A9 с NEON на частоте 1 ГГц (часть Zynq чипа Z7020 по Xilinx) | |
Сопроцессор | 16-ядерный многоядерный ускоритель Epiphany III (E16) | ||
объем памяти | 1 ГБ оперативной памяти DDR3L | ||
Ethernet | 10/100/1000 | ||
USB | N / A | 2 × USB 2.0 (USB 2.0 HS и USB OTG) | |
Отображать | N / A | HDMI | |
Место хранения | 16 ГБ microSD | ||
Расширение | N / A | 2 ссылки eLink + 24 GPIO | 2 ссылки eLink + 24 GPIO |
ПЛИС | 28K программируемых логических ячеек 80 программируемых сегментов DSP | 80K программируемых логических ячеек 220 программируемых сегментов DSP | |
Масса | 36 г (1,3 унции) | 38 г (1,3 унции) | |
Размер | 3,5 дюйма × 2,1 дюйма × 0,625 дюйма (88,9 мм × 53,3 мм × 15,9 мм) | ||
SKU | P1600-DK-xx | P1601-DK-xx | P1602-DK-xx |
Код HTS | 8471.41.0150 | ||
Мощность | Питание от USB (2,5 Вт) или 5 В постоянного тока (≈5 Вт) |
Богоявление V
К 2016 году компания записала 1024-ядерный 64-разрядный вариант своей архитектуры Epiphany, в котором были представлены: более крупные локальные хранилища (64 КБ), 64-разрядная адресация, арифметика с плавающей запятой двойной точности или SIMD одинарной точности и 64-битные целочисленные инструкции, реализованные в технологическом узле 16 нм . [21] Эта конструкция включала усовершенствования набора команд, предназначенные для приложений глубокого обучения и криптографии . В июле 2017 года основатель Adapteva стал менеджером программы DARPA MTO [22] и объявил, что Epiphany V «вряд ли» станет доступным в качестве коммерческого продукта. [23]
Представление
Джоэл Хруска из ExtremeTech придерживался следующего мнения о 64-ядерном проекте Parallella, предшествовавшем 1024-ядерному проекту: «Adapteva резко переоценивает то, что на самом деле может предоставить Epiphany IV. 16–64 крошечных ядра с небольшим объемом памяти, без локальной кеши и относительно низкая тактовая частота все еще могут быть полезны при определенных рабочих нагрузках, но участники не покупают суперкомпьютер - они покупают реальный эквивалент самоуплотняющегося болта штока ». [24]
Критика того, что чипы Epiphany не могут обеспечить производительность даже близко к современным суперкомпьютерам, тем не менее, верна: на самом деле чипы Epiphany с 16-ядерным или 64-ядерным процессором и т. Д. 25 или 100 гигафлопс с одинарной точностью, соответственно, даже не соответствуют производительности с плавающей запятой современных процессоров для настольных ПК (Core i7-4770K (Haswell), 4 ядра @ 3,5 ГГц AVX2: 177 гигафлопс, [25] двойной- точность) - факт, признаваемый Адаптьевой. [ необходима цитата ]
Однако новейшие платы Parallella с чипами E16 Epiphany [26] можно сравнить со многими историческими суперкомпьютерами с точки зрения необработанной производительности (например, Cray 1 - первый суперкомпьютер сам по себе - имел пиковую производительность 80 MFLOPS в 1976 г. , и его преемник Cray 2 имел пиковую производительность 1,9 GFLOPS в 1985 году) и, безусловно, может использоваться для разработки параллельного кода. Архитектурное сходство с суперкомпьютерами (передача сообщений и NUMA ) делает Parallella потенциально полезной системой разработки по сравнению с традиционными SMP-машинами. [ необходима цитата ]
Дело в том, что для огибающей мощности 5 Вт и с точки зрения GFLOPS / мм 2 пространства кристалла чипа нынешние чипы E16 Epiphany обеспечивают гораздо большую производительность, чем что-либо другое, доступное на сегодняшний день [ когда? ] , с архитектурой, разработанной для масштабирования и применимой не только к досадно параллельным задачам графического процессора. [ необходима цитата ] (например, он будет способен запускать модель актора со многими параллельными, полностью независимыми состояниями). Он также подходит для задач, подобных DSP, когда данные могут подаваться непосредственно на кристалл (с FPGA или другой ASIC) без необходимости создавать буферы во временной памяти, как для графического процессора), что делает его идеальным для робототехники и других приложений интеллектуальных датчиков. Архитектура также позволяет объединять параллельные платы в кластер с быстрым межкристальным соединением «eMesh», расширяя логическую сетку ядер (создавая практически неограниченный потенциал масштабирования). [ необходима цитата ]
16-ядерный Parallella имеет примерно 5,0 Гфлопс / Вт, а 64-ядерный Epiphany-IV с 28-нм технологией оценивается как 50 ГФЛОП / Вт (одинарная точность) [27] и 32- платная система на их основе имеет 15 Гфлопс. / Вт. [28] Для сравнения: топовые графические процессоры AMD и Nvidia достигли 10 Гфлопс / Вт для одинарной точности в период 2009–2011 годов. [29]
Смотрите также
- Асинхронный массив простых процессоров
- SW26010 - китайский дизайн с аналогичной архитектурой, используемый в суперкомпьютере Sunway TaihuLight.
- Vision Processing Unit - класс процессоров со значительными перекрывающимися функциями
Рекомендации
- ↑ Кларк, Дон (3 мая 2011 г.). «У стартапа большие планы по технологии крошечных чипов» . Wall Street Journal . Проверено 3 мая 2011 года .
- ^ «IBM заявляет, что технология Kilocore превзойдет современные мобильные процессоры» . Оборудование Тома. 2006 г.
- ^ «От RTL до GDSII всего за шесть недель» . EETimes. 2010 . Проверено 26 октября 2010 года .
- ^ «Справочное руководство по архитектуре Epiphany» . Архивировано из оригинала 9 октября 2012 года .
- ^ «Стартап запускает технологию многоядерного ускорения с плавающей запятой» . HPCWire. 2011 . Проверено 3 мая 2011 года .
- ^ «Epiphany Multicore IP. Примеры конфигураций» . 19 августа 2012 г.
- ^ Epiphany-III 16-ядерный 65-нм микропроцессор (E16G301) // администратор (19 августа 2012 г.)
- ^ Epiphany-IV 64-ядерный 28-нм микропроцессор (E64G401) // администратор (19 августа 2012 г.)
- ^ Кремниевые устройства // Адаптева.
- ^ Линли Гвеннап, Адаптева: больше провалов, меньше ватт. Epiphany предлагает ускоритель с плавающей запятой для мобильных процессоров. // Отчет о микропроцессоре , июнь 2011 г.
- ^ Майкл Фельдман, Adapteva представляет 64- ядерный чип // HPCWire
- ↑ Андреас Олофссон, Выпуск документации Epiphany
- ^ Обновление №46: видео, созданное первым пользователем Parallella
- ↑ Рик Мерритт, Адаптева запускает стодолларовый суперкомпьютер // EETimes, 27 сентября 2012 г.
- ^ Parallella - суперкомпьютеры для всех (слайд-каст) . Основатель и генеральный директор Adapteva Андреас Олофссон . 28 сентября 2012 г.
- ^ Parallella: суперкомпьютер для всех от Adapteva , страница проекта на Kickstarter
- ^ Parallella: суперкомпьютер для всех // Проект Kickstarter, Adapteva
- ^ Гайавата Брей, Адаптева создает эффективный и дешевый микрочип с помощью Kickstarter. «Краудфандинг» приближает к производству крошечный и быстрый компьютер // The Boston Globe, 2 декабря 2012 г.
- ^ Эндрю Бэк, Представляем суперкомпьютер Linux за 99 долларов. Архивировано 17 ноября 2015 года на Wayback Machine , Linux.com, 24 января 2013 года: «обещания в размере 99 долларов или более вознаграждаются хотя бы одной платой с 16-ядерным устройством. .. 16-ядерный чип Epiphany обеспечивает производительность 26 гигафлопс, а весь компьютер Parallella потребляет всего 5 Вт »
- ^ Предлагается 64-ядерная версия платы Parallella! // Блог Adapteva на Kickstarter, 25 октября 2012 г .: «Плата Parallella с ядром Epiphany-IV (64 + 2) будет предлагаться по цене выше 750 долларов ... тот факт, что мы получаем только 50 кристаллов на пластину для этого первоначального прототипа Мы не можем раскрывать информацию о ценах на полупроводниковые пластины и их доходности при 28 нм ",
- ^ "Крещение в объявлении" .
- ^ Олофссон, Андреас (11 марта 2017 г.). "Мистер Андреас Олофссон" . DARPA . Проверено 16 декабря 2018 года .
- ^ Олофссон, Андреас (9 июля 2017 г.). «Обновление статуса Адаптева» . Блог Адаптева . Архивировано 23 апреля 2018 года . Проверено 16 декабря 2018 года .
- ^ Джоэл Хруска (28 сентября 2012 г.). «Адаптева обращается к Kickstarter, чтобы профинансировать массовый параллельный процессор» . Extremetech.
- ^ Доктор Дональд Кингхорн (26 августа 2013 г.). «Производительность Haswell с плавающей запятой» . Блог Puget Systems .
- ^ Андреас Олофссон (14 июля 2014 г.). «Новые предложения продуктов Parallella» . Блог Parallella . Проверено 3 сентября 2014 года .
- ^ Фельдман, Майкл (22 августа 2012 г.). «Адаптева представляет 64-ядерный чип» . HPCWire . Проверено 3 сентября 2014 года .
- ^ «Adapteva представляет суперкомпьютерную платформу A-1 на ISC14» . HPCWire, пресс-релиз Адаптева. 23 июня 2014 . Проверено 3 сентября 2014 года .
- ^ «Характеристики аппаратного обеспечения CPU, GPU и MIC с течением времени. Необработанная вычислительная производительность - сравнение GFLOP / sec на ватт для арифметики с одинарной точностью. Чем выше, тем лучше» . Карл Рупп. 24 июня 2013 . Проверено 3 сентября 2014 года .
дальнейшее чтение
- Линли Гвеннап, Адаптева: Больше провалов, меньше ватт. Epiphany предлагает ускоритель с плавающей запятой для мобильных процессоров. // Отчет о микропроцессоре , июнь 2011 г.
Внешние ссылки
- Официальный веб-сайт
- Технические характеристики Parallella