开源大数据周刊-第102期
資訊
- 重磅:Cloudera、Hortonworks 合并 !
兩家大數據先驅Cloudera和Hortonworks今天宣布了它們所謂的相對平等的合并,聲稱將把兩家公司合并成一家年收入達7.2億美元的新實體。
- 互聯網之父開源「去中心化平臺 Solid」,讓用戶掌控數據控制權
萬維網之父 Tim Berners-Lee 爵士對今天的中心化 Web 非常不滿,他想要拯救互聯網,方法是重新去中心化。他正式宣布了新的開源去中心化平臺 Solid ,源代碼發布在 GitHub 上:https://github.com/solid。
- Hadoop 衰敗的 4 個原因
Cloudera和Hortonworks合并的這項交易意味著Hadoop市場再也維持不了兩大競爭對手。多年來,Hadoop一直就是大數據的代名詞,但市場和客戶需求已然發生了變化,本文分析了幾個大趨勢如何共同推動了這個變化。
- Elastic 的成功上市:偶然和必然
假期期間有個公司上市了,首日大漲,市值接近50億美元,又掀起了一波造富運動,這個公司就是Elastic。作為后端的程序員,如果沒有聽說過Elastic及其產品Elasticsearch,實在是太out了,快來了解一下吧。
技術
- 流計算框架Flink與Spark Streaming性能對比
Fink和Spark Streaming是目前比較主流的實時計算引擎,為了深入了解它們之間的差異,各自存在的優勢和劣勢,評估實時處理性能,找到其性能瓶頸并對其進行優化,我們對這兩個引擎做了一系列的測試,希望為后續實時計算框架選擇、性能調優提供數據參考。
- 大數據涼了?No,流式計算浪潮才剛剛開始!
本文翻譯自《Streaming System》最后一章《The Evolution of Large-Scale Data Processing》,簡要回顧了大數據系統發展的歷史軌跡,重點討論了流處理系統。行文輕松活潑,內容通俗易懂,不妨一讀。
- Uber開源Marmaray:基于Hadoop的通用數據攝取和分散框架
對于搭建大數據平臺和數據湖,通常而言是作為ETL的基礎,廣泛地采集各種數據源存儲到Hadoop,來進行數據挖掘和分析。Uber新開源的Marmaray項目除了數據采集外,還包括數據分發,將Hadoop數據湖中的數據同步到各個在線存儲系統,滿足在線處理對性能和質量的更高要求。
- 支持流式處理ACID事務!Flink團隊開源新作Streaming Ledger
近日,由 Apache Flink 創始人創立的 data Artisans 宣布開源 Streaming Ledger——一項激動人心的新技術,為基于流式架構的應用程序帶來了串行化 ACID 事務支持。在這篇文章中,我們將解釋為什么串行化 ACID 事務對于現代企業來說是一個巨大的挑戰、data Artisans 如何找到解決方案以及如何將這項技術用于流式應用程序。
- 開源Kubeflow:在Kubernetes上運行機器學習
近年來Tensorflow和Kubernetes在AI和云計算領域都是異彩紛呈,火熱得可以,放在一起又怎么樣呢?本文是一篇關于Kuberflow:Kubernetes+Tensorflow入門級的介紹,了解一下?
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
以上是生活随笔為你收集整理的开源大数据周刊-第102期的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 阿里P7架构师谈职业生涯规划,给遇到瓶颈
- 下一篇: JSP动作标签