NextSilicon (@nextsilicon) представляет вычислительный стек, который стремится сохранить актуальность устаревшего кода высокопроизводительных вычислений, одновременно перенаправляя большую часть работы на выделенный ускоритель, вместо того чтобы заставлять каждую команду переписывать ядра для нового API. В этом интервью Дэн (ведущий инженер) формулирует цель как «бесшовное ускорение»: взять существующий код на C/C++/Fortran, перекомпилировать его с помощью тонкой обертки на основе LLVM и позволить компилятору выделить области, которые отображаются на устройстве. https://www.nextsilicon.com/
---
Технология HDMI® является основой для глобальной экосистемы устройств, подключенных через HDMI; она интегрирована с дисплеями, телеприставками, ноутбуками, аудио-видеоресиверами и другими типами продуктов. Из-за такого глобального использования производители, реселлеры, интеграторы и потребители должны быть уверены, что их продукты HDMI® бесперебойно работают вместе и обеспечивают наилучшую возможную производительность, приобретая продукты у лицензированных HDMI-адаптеров или авторизованных реселлеров. Для кабелей HDMI потребители могут искать официальные сертификационные этикетки HDMI® на упаковке. Инновации продолжаются с новейшей спецификацией HDMI 2.2, которая поддерживает более высокую пропускную способность 96 Гбит/с и технологию HDMI Fixed Rate Link следующего поколения, обеспечивающую оптимальное качество звука и видео для широкого спектра устройств. Поддерживаются более высокие разрешения и частоты обновления, включая до 12K@120 и 16K@60. Кроме того, поддерживаются более высококачественные варианты, включая несжатые форматы с полной цветовой гаммой, такие как 8K@60/4:4:4 и 4K@240/4:4:4 с 10-битным и 12-битным цветом.
--
Первый продукт — Arbel, высокопроизводительное ядро ЦП RISC-V, разработанное на 5-нм техпроцессе TSMC, позиционируемое как аналог ускорителя, ориентированный на снижение задержки. Основной упор делается на классическую внеочередную обработку инструкций и высокую производительность на такт: очень широкий интерфейс (упоминается декодирование 10 инструкций), глубокие окна инструкций и агрессивное планирование для уменьшения последовательной части реального кода во время выполнения.
Второй продукт — ускоритель потоков данных Maverick, где параллельная работа представлена в виде графа потоков данных и «проецируется» на аппаратное обеспечение для построения конвейеров и дублирования проекций для повышения пропускной способности. На стенде упоминаются цифры, например, 20-кратное увеличение по сравнению с ЦП и 4-кратное по сравнению с ГП, но более важный момент — это путь компиляции: никакой полной переработки, только перекомпиляция и автоматическое сопоставление графа с графом устройства.
Аппаратная часть также имеет значение: Gen1 уже используется для оценки в нескольких национальных лабораториях, а Gen2 расширяется как за счет однокристальных карт PCIe (примерно класса 350 Вт), так и за счет более мощного двухкристального модуля в сочетании с HBM, соединенного между собой для работы в качестве более крупного логического устройства. Среди представленных партнеров — стоечные системы и платформы в стиле OAM (с такими названиями, как HP, Dell и Penguin Computing), которые подключают несколько плат к одному центральному процессору в стандартной серверной конфигурации.
Здесь полезен закон Амдала: даже «идеальные» ускорители останавливаются на труднодоступной последовательной части, поэтому сочетание мощного ядра ЦП с высокопроизводительной машиной может значительно повысить производительность без необходимости делать вид, что все работает в режиме параллельного выполнения. Разговор, снятый на выставке суперкомпьютеров SC25 в Сент-Луисе, затрагивает вопросы эргономики для разработчиков команд MPI/OpenMP, векторизованных ядер и долгосрочных кодовых баз, которые хотят увеличить производительность в FLOP/W, не начиная с нуля в новой модели программирования.
Я публикую более 90 видеороликов с Embedded World North America 2025, загружаю около 4 видео в день в 5:00/11:00/17:00/23:00 CET/EST. Присоединяйтесь к https://www.youtube.com/charbax/join, чтобы получить ранний доступ ко всем 90 видео (как только они будут добавлены в очередь в ближайшие несколько дней). Посмотрите все мои видео о Embedded World North America в плейлисте Embedded World здесь: • Embedded World
Это видео было снято с помощью DJI Pocket 3 (669 долларов США на https://amzn.to/4aMpKIC с использованием двух беспроводных микрофонов DJI Mic 2 и петличного микрофона DJI https://amzn.to/3XIj3l8), посмотрите все мои видео о DJI Pocket 3 здесь: • Filmed with DJI Pocket 3
Нажмите кнопку «Суперспасибо» под видео, чтобы отправить выделенное сообщение. Оставляйте комментарии под видео! Бренды, чьи видео я снимаю, могут поддержать мою работу таким образом 😁
Посмотрите моё видео с компанией Daylight Computer о их революционном трансфлект...
Информация по комментариям в разработке