Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Потоковые процессоры, Inc была Silicon ValleyFabless полупроводниковой компании , специализирующейся на разработке и производстве высокопроизводительных цифровых сигнальных процессоров для приложений , включая системы видеонаблюдение, многофункциональные принтеры и видеоконференции. Компания прекратила деятельность в 2009 году.

История компании [ править ]

Основополагающая работа по потоковой обработке была начата в 1995 году исследовательской группой под руководством профессора Массачусетского технологического института Билла Далли . В 1996 году он перешел в Стэнфордский университет, где продолжил эту работу, получив многомиллионный грант от DARPA с дополнительными ресурсами от Intel и Texas Instruments для финансирования разработки проекта под названием «Imagine» - первого чипа потокового процессора и сопровождающего его компилятора. инструменты.

Проект Imagine [ править ]

Целью проекта Imagine была разработка программируемого процессора сигналов и изображений на языке C, предназначенного для обеспечения как плотности производительности, так и эффективности процессора специального назначения (такого как аппаратная ASIC ). Проект успешно продемонстрировал преимущества потоковой обработки. Подробная информация о проекте Imagine и его результатах размещена на странице проекта Stanford Imagine . Работа также показала, что ряд приложений, начиная от беспроводной обработки основной полосы частот, трехмерной графики, шифрования, IP-переадресации и заканчивая обработкой видео, могут воспользоваться преимуществами эффективности потоковой обработки. Это исследование вдохновило другие разработки, такие как графические процессоры от ATI Technologies, а такжеСотовый микропроцессор от Sony , Toshiba и IBM .

Основные результаты программы Imagine:

  • Архитектура Imagine Stream
  • Модель программирования Stream
  • Инструменты разработки программного обеспечения
  • Программируемая графика и мультимедийные приложения в реальном времени
  • Прототип СБИС (изготовлен TI)
  • Платформа разработки потокового процессора (прототип платы для разработки)

SPI установлен [ править ]

Далли вместе с другими членами команды получил в Стэнфорде лицензию на коммерциализацию полученной технологии. Stream Processors, Incorporated (SPI) была зарегистрирована в Калифорнии в 2004 году. Профессор Далли остался в Стэнфорде, и компания наняла ветерана отрасли Чипа Стернса [3], чтобы он стал президентом и генеральным директором в декабре того же года. К июню 2006 года SPI удалось привлечь в общей сложности 26 миллионов долларов от трех известных фирм венчурного капитала - Austin Ventures , Norwest Venture Partners и Woodside Fund.

Компания выпустила свои первые два продукта одновременно с Международной конференцией по твердотельным схемам ( ISSCC ) в феврале 2006 года [1] и с тех пор представила еще два. [2] [3]

Штаб-квартира SPI находится в Саннивейле, Калифорния, а также группа разработки программного обеспечения (SPI Software Technologies Pvt. Ltd), расположенная в Бангалоре, Индия .

В январе 2009 года соучредитель профессор Билл Далли принял должность главного научного сотрудника NVIDIA Corporation. [4] В то же время он ушел с поста председателя. [5] В интервью Далли рассказал о своем опыте работы со стартапами: [5]«Я сам создал несколько микросхем. Это становится все труднее. Ставка очень высока. Если вы создаете чип-стартап, вам нужны терпеливые инвесторы с очень большими карманами. Чтобы получить первый продукт, нужно много десятков миллионов долларов и 50 долларов. миллионов, чтобы получить прибыль. Это очень сложно сделать, потому что инвесторы хотят получить выход, несколько превышающий эти инвестиции. Я надеюсь, что мы вернемся к временам частых IPO и выйдем за рамки массовых поглощений. Это не то, что вы можете видеть прямо сейчас . Если это программируемый чип, то стоимость еще больше ».

Летом 2009 года генеральный директор Стернс покинул компанию, и его заменил Майк Фистер, руководитель с опытом работы на высшем уровне в Cadence Design Systems и Intel .

В сентябре 2009 года компания прекратила свою деятельность. [6]

Технология [ править ]

Подобно графике и научным вычислениям, мультимедиа и обработка сигналов характеризуются доступным параллелизмом данных, локальностью и высоким соотношением вычислений и доступа к глобальной памяти. Потоковая обработка использует эти характеристики с помощью параллельной обработки данных, питаемой иерархией распределенной памяти, управляемой компилятором. Основная проблема для процессоров с массовым параллелизмом следующего поколения - это полоса пропускания данных, а не вычислительные ресурсы. В отличие от большинства обычных процессоров, эта технология не полагается на аппаратный кеш - вместо этого движением данных явно управляет компилятор и оборудование.

Модель выполнения основана на ускорении критических для производительности функций (ядер), которые обрабатывают и создают записи данных (потоки). Ядра и потоки планируются во время компиляции и перемещаются во внутреннюю память во время выполнения через табло. Компилятор анализирует данные потоков в реальном времени, чтобы оптимизировать распределение и минимизировать потребности в полосе пропускания внешней памяти. Загрузка потоков и ядер может перекрываться с выполнением для повышения устойчивости к задержкам, а явное перемещение данных обеспечивает предсказуемую производительность. Отсутствуют промахи в кэше ЦП, и дизайн представляет собой одноядерную модель для программиста - параллелизм данных находится внутри ядер.

Архитектура [ править ]

Архитектура включает в себя центральный процессор (System MIPS) для задач системного уровня и подсистему сопроцессора DSP, в которой MIPS DSP запускает основные потоки, которые выполняют вызовы функций ядра в параллельном блоке данных (DPU). Для пользователей, которые используют библиотеки и не собираются разрабатывать код DSP, архитектура представляет собой систему на кристалле на основе MIPS с API для сопроцессора «черного ящика» . Диспетчер DPU принимает вызовы функций ядра для управления загрузкой ядра во время выполнения и потоковой передачи. Одно ядро ​​за раз выполняется по дорожкам, оперируя данными локального потока, хранящимися в файле регистров дорожек каждой дорожки. На каждой полосе есть набор VLIW ALU.и файлы распределенных регистров операндов (ORF) позволяют обрабатывать большой набор данных и пропускную способность, превышающую 1 Терабайт / с. Блок загрузки / сохранения потока обеспечивает сбор / рассылку с широким спектром шаблонов доступа. InterLane Switch - это запланированная компилятором полная перекрестная панель для высокоскоростного доступа между полосами движения.

Инструменты [ править ]

Пакет SPI RapiDev Tools Suite использует предсказуемость потоковой обработки, чтобы обеспечить быстрый путь к оптимизированным результатам с помощью программирования на C. Начиная со справочного кода C, библиотека Fast Functional Debugger (FFD) подключается к стандартным инструментам, таким как Microsoft Visual Studio и GNU, и имитирует DPU для поддержки реструктуризации кода в ядра и потоки. Поскольку ядра планируются статически, а перемещение данных является явным, точность цикла DPU может быть достигнута даже на этом высоком функциональном уровне. Это один из источников предсказуемости архитектуры. Для нацеливания кода на устройство компилятор потокового процессора (SPC) генерирует исполняемый файл VLIW и предварительно обработанный код C, который компилируется / связывается через стандартный GCC для MIPS. SPC выделяет потоки в файлах регистров дорожек и предоставляет информацию о зависимостях для вызовов функций ядра. Конвейерная обработка программного обеспечения и развертывание циклаподдерживаются. Штрафы за переход можно избежать с помощью предикативного выбора, а более крупные условные выражения используют условные потоки. Симулятор целевого кода, работающий под управлением Eclipse, обеспечивает комплексное моделирование двоичного кода хоста или устройства с точками останова и возможностью пошагового выполнения со статистикой пропускной способности и нагрузки. В представлении ядра показан конвейер VLIW для оптимизации ядра, а в представлении потока показано выполнение ядра и потоковая загрузка для проверки глобального перемещения данных для профилирования системы.

Продукты [ править ]

SPI в настоящее время продает семейство Storm-1, которое включает четыре полностью программируемых DSP с различными уровнями производительности.

Примечание. GMACS означает гига (миллиарды) операций умножения-накопления в секунду, что является общим показателем производительности DSP.

Поддержка аппаратного и программного обеспечения [ править ]

  • Набор инструментов RapiDev обеспечивает быстрый и предсказуемый путь к оптимизированным результатам, устраняя сложности, связанные с кодированием сборки или ручным управлением кешем.
  • Storm-1 DevKit - это платформа разработки программного обеспечения на базе PCI.
  • Эталонный дизайн IP-камеры работает под управлением стандартной Linux 2.6 и поддерживает несколько одновременных кодеков (например, H.264 , MPEG-4 и MJPEG ), произвольное разрешение, обработку CMOS и CCD сенсоров, а также видеоаналитику на полностью программируемой платформе.
  • Эталонный дизайн видеостримера поддерживает восемь входных каналов 4CIF для видео, сжатого до H.264, и выход Gigabit Ethernet.

Ссылки [ править ]

  1. ^ EETimes.com - Startup рекламирует архитектуру потоковой обработки для DSP
  2. ^ DSP с параллельными данными, предназначенный для недорогих приложений для видеонаблюдения | Video Imaging DesignLine
  3. ^ EETimes.com - Потоковые процессоры заявляют о самом быстром DSP
  4. ^ [1]
  5. ^ а б [2]
  6. ^ http://sanjose.bizjournals.com/sanjose/stories/2009/11/02/daily124.html

Внешние ссылки [ править ]

  • Веб-сайт Imagine Project (Стэнфорд)

Координаты : 37 ° 22′59,48 ″ с.ш. 122 ° 04′42,08 ″ з.д. / 37.3831889°N 122.0783556°W / 37.3831889; -122.0783556