SGI анализирует Twitter
Компьютер “Big Brain” компании SGI используется для Глобального Такта Твиттера
Выявление надежд и страхов в мире на основе анализа в реальном времени данных твиттера на SGI® UV™ 2000 -- #tweetbeat
Компания SGI (NASDAQ: SGI), признанный лидер в технических вычислениях, объединилась с Калевом Х. Литару из Университета штата Иллинойс и доктором Шаовен Вангом, представляющим Лабораторию киберинфраструктуры и геопространственной информации (CIGI) Университета штата Иллинойс в Урбана-Шампейн, чтобы создать Глобальный Такт Твиттера (Global Twitter Heartbeat) – первую тональную и географическую визуализацию и анализ твитов в режиме реального времени на основе компьютера SGI UV 2000 “Big Brain”. Способность к анализу больших данных в режиме реального времени сложными способами позволяет организациям (от правительства до предприятия) получать немедленные и действенные идеи, применимые к множеству приложений. Благодаря этой возможности, исследователи, ученые и инженеры, которые всё чаще сталкиваются проблемами большого количества данных, могут быстрее продвигаться от данных к результатам.
Проект Глобальный Такт Твиттера выполняет потоковую обработку в режиме реального времени десяти процентов из 500 000 000 ежедневных записей (твитов) в твиттере. Проект анализирует каждый твит, назначая местоположение (не только по GPS-меткам твитов, но и обработкой текста твита) и тон и затем визуализирует диалог в инфографическую тепловую карту, которая показывает место, плотность и тон твитов в единой геопространственной перспективе. С помощью SGI UV, весь процесс от захвата до анализа данных для работы тепловой карты выполняется на скорости, которая позволяет визуализировать карту со скоростью кадр в секунду.
Проект зафиксировал два недавних важных событий - ураган Сэнди и президентские выборы в США. В обоих случаях, были отправлены миллионы твитов, что делает твиттер мощной платформой для общения и понимания того, что происходит в каждый момент.
Во время президентских выборов в США было зафиксировано 327452 твитов в минуту, после выпусков новостей, начавших предсказывать победу Обамы. Твит президента Обамы по поводу победы быстро стал самым повторяемым твитом в истории, установив рекорд всего за 22 минут после отправки твита¹.
Просматривая замедленную анимацию тепловых карт, зрители могут вновь пережить события, происходившие в твиттере. Проект зафиксировал значительное увеличение трафика твиттера когда ураган Сэнди приблизился, вышел на сушу и взял свой курс на восточное побережье США. Для президентских выборов в США, тепловые карты показали динамику интенсивности и расположения твитов благоприятных либо президенту Бараку Обаме, либо губернатору Митту Ромни в течение дня выборов, с первых опросов и до победной речи президента Обамы.
«Этот метод анализа данных в реальном времени, как новый телескоп в наших руках. Мы впервые видим твиттер таким образом, и мы все еще не совсем уверены, как понять его и что он говорит нам, но он позволяет нам в первый раз всмотреться в хаотический мир, который является сердцем нашего общества», сказал Литару. «SGI UV позволяет пользователям вернуться к традиционному подходу принятия решений с возможностью получить представление, как они происходят, к тому, что я бы назвал «пост-демографический Мир», в котором мы можем видеть надежды и страхи каждого человека в реальном времени, а не просто наклеивать им основные демографические ярлыки».
SGI UV: Компьютер “Big Brain” («Большой Мозг»)
SGI UV 2000 является крупнейшим в мире компьютером для анализа данных, который может задействовать до 4096 ядер и до 64 терабайт кэш-когерентной глобальной общей памяти с пиковой скоростью ввода/вывода до четырех терабайт в секунду (14 ПБ/час). Это соответствует передаче всего содержимого Библиотеки Конгресса США менее чем за три секунды. Начав всего лишь с 16 ядер и 32 гигабайтов памяти, SGI UV 2 может затем масштабироваться до тысяч ядер и терабайт оперативной памяти. SGI UV используется для высокопроизводительного анализа данных в таких областях исследований, как космология и геномика, а также для коммерческих приложений, в том числе таких как выявление случаев мошенничества.
«Мы гордимся тем, что разработали инструменты и технологии для ученых, аналитиков и инженеров, которые позволяют им найти ответы на свои наиболее сложные проблемы», сказал Хорхе Титингер, президент и исполнительный директор SGI. «Понимание больших данных требует большего, чем может обеспечить традиционный анализ данных и идет движение в сторону высокопроизводительного анализа данных, где данные в режиме реального времени могут быть конвертированы в реальные доллары и центы для любой организации».
Пожалуйста, посетите SGI на стенде № 2631, чтобы увидеть действующий Глобальный Такт Твиттера на дисплее 3D PufferSphere®. В ходе шоу, живое изображение анализа твиттера в реальном времени доступно странице проекта Глобальный Такт Твиттера на facebook.com. Выскажите ваше мнение о проекте с помощью хэштэга #tweetbeat. Подробная информация о решениях SGI UV и SGI доступна на сайте sgi.com.
О CIGI
Лаборатория киберинфраструктуры и геопространственной информации (CIGI) при Университете штата Иллинойс в Урбана-Шампейн исследует и разрабатывает передовые киберинфраструктуры для продвижения геопространственной науки и технологий. Доктор Шаовен Вангом – основатель и директор CIGI, и Эрик Шук CIGI – технический руководитель этого проекта. Тепловые карты проекта были получены с использованием передового анализатора данных CyberGIS, представляющего новое поколение географических информационных систем (ГИС) на основе суперкомпьютерной и киберинфраструктурной среды. Вклад CIGI в проект частично финансово поддержан грантами Национального научного фонда с номерами: BCS-0846655 и OCI-1047916. Любые мнения, результаты, заключения или рекомендации, выраженные в проекте, принадлежат членам CIGI и не обязательно отражают точку зрения Национального научного фонда.
О Gnip
Gnip является крупнейшим в мире поставщиком государственных социальных медиа-данных, обслуживающим клиентов в различных отраслях промышленности от социального мониторинга средств массовой информации и бизнес-аналитики для финансовых кругов и правительства. Gnip поставляет более 100 млрд данных социальной деятельности каждый месяц, обеспечивая неограниченный доступ к данным из десятков источников, включая Twitter, Tumblr, WordPress, Disqus и многие другие. Для получения дополнительной информации, свяжитесь электронной почте:
Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript
или посетите сайт http://gnip.com
О Минимакс
Компания Минимакс с 2012г. выполняет функции центра компетенций, дистрибутора, регионального склада запасных частей (Россия и СНГ) и центра технической поддержки по продукции и решениям SGI.