
АНАЛИЗ НОВОСТЕЙ: Apache Hadoop открывает много возможностей для анализа больших данных, но существует также сложность в приложениях и методах для того, чтобы эффективно управлять этим данные.У САН-ХОСЕ, Бизнеса Калифорнии, науки и академических исследователей есть доступ к беспрецедентному массиву данных, чтобы взорвать и обнаружить значительные тренды, от болтовни социальной сети до образцов потребительской покупки, операций по кредитной карте и даже спортивной статистики.
Но динамики на Саммите Hadoop здесь 10 июня отметили, что много организаций не знают о новых методах, которые они могут использовать для анализа гор данных для получения значимого понимания.Один докладчик использовал спортивную статистику, чтобы проиллюстрировать, что новые компании по подходам должны рассмотреть имея дело с большими данными.
«На спортивных состязаниях мы тонем в данных, но это в основном неэффективно, потому что это должно быть женато с маленькими данными», сказал Дэвид Эпштейн, автор Спортивного Гена: В Науке об Экстраординарной Спортивной Производительности.Он использовал пример спринтеров, указывание там является обычно только вторым или меньше различием между теми, кто последовательно приходит первым или второй и те, кто заканчивает все дальше назад в поле.
Он сказал, что находящаяся на стадии становления область спортивной науки использует «маленькие данные», чтобы видеть, как спортсмены могут улучшить производительность.В одном случае исследователи проанализировали три основных переменные в том, как три главных Олимпийских толкателя ядра бросают выстрел. Они обнаружили золотого призера, освобожденного под углом на один градус выше, чем его конкуренты.
Точно так же исследователи проявили новый подход к исследованию методов широких перемычек. В то время как прошлые исследования посмотрели на вещи как скорость и сила, с которой перемычки взлетели от платы, меньший набор данных биомеханическим специалистом по переходу показал, что основное отличие для победителя было углом скидки. Используя это данные, широкая перемычка из Великобритании изменила его обучение и выиграла золотую медаль даже при том, что он не был одобрен.
Каков урок для бизнеса в этих примерах? Как на спортивных состязаниях, часто различие между хорошим и большим составляет меньше чем один процент.
Компания могла бы найти, например, что некоторый маленький незначительный сбой в обслуживании клиентов или ответе мешает ей быть вершинами на своем рынке.TrueCar находит, что Хэдуп повышает ценность
Одна компания, которая перемещалась настойчиво для получения больше от больших данных, является автомобильной службой покупки TrueCar, которая поддерживает крупную самую современную базу данных продажных цен. Расс Фолц-Смит, глава платформы данных компании сказал самую сложную задачу, с которой она стояла, когда она увеличила усилия использовать Hadoop-приводимую-в-действие систему для управления, ее «несколько петабайтов» данных находил квалифицированных разработчиков.Находя немного квалифицированных претендентов, это решило нанять и обучить разработчика в использовании Hadoop и пошло оттуда. «Это было трудное решение, но теперь у нас есть более чем 25 экспертов Hadoop, и мы являемся чрезвычайно эффективными при найме больше».
TrueCar имеет 600 TB данных в активном использовании в любой момент и более чем 20 миллионах профилей покупателя.«Идея состоит в том, чтобы быть мозгом отрасли», сказал Фолц-Смит. «Важная вещь – Вы, не может быть неправильным в автомобильной промышленности. Если Вы неправы, Вы теряете операцию».
Оставаясь в лезвии, TrueCar недавно разработал то, что говорит Фолц-Смит, усовершенствованная, многомерная возможность поиска в реальном времени.