99re热视频这里只精品,久久久天堂国产精品女人,国产av一区二区三区,久久久精品成人免费看片,99久久精品免费看国产一区二区三区

在沒(méi)有聯(lián)網(wǎng)的情況下運(yùn)行Samza

2018-08-21 18:39 更新

本教程將幫助您運(yùn)行 Hello Samza,如果您無(wú)法連接到互聯(lián)網(wǎng)。

測(cè)試您的連接

Ping irc.wikimedia.org,有時(shí)公司的防火墻會(huì)阻止這項(xiàng)服務(wù)。

telnet irc.wikimedia.org 6667

你應(yīng)該看到這樣的東西:

Trying 208.80.152.178...
Connected to ekrem.wikimedia.org.
Escape character is '^]'.
NOTICE AUTH :*** Processing connection to irc.pmtpa.wikimedia.org
NOTICE AUTH :*** Looking up your hostname...
NOTICE AUTH :*** Checking Ident
NOTICE AUTH :*** Found your hostname

否則,您可能有連接問(wèn)題。

使用本地?cái)?shù)據(jù)運(yùn)行 Hello Samza

我們提供了一個(gè)選擇, 以獲取維基百科提供的數(shù)據(jù),而不是運(yùn)行:

deploy/samza/bin/run-job.sh --config-factory=org.apache.samza.config.factories.PropertiesConfigFactory --config-path=file://$PWD/deploy/samza/config/wikipedia-feed.properties

你會(huì)運(yùn)行:

bin/produce-wikipedia-raw-data.sh

該腳本將從本地文件讀取維基百科提供的數(shù)據(jù),并將其產(chǎn)生到 Kafka 代理。默認(rèn)情況下,它生成本地主機(jī):9092作為 Kafka 代理,并使用 localhost:2181 作為 zookeeper。您可以覆蓋它們:

bin/produce-wikipedia-raw-data.sh -b yourKafkaBrokerAddress -z yourZookeeperAddress

現(xiàn)在您可以回到 Hello Samza中的 Generate Wikipedia Statistics 部分,并按照剩余的步驟進(jìn)行。

一點(diǎn)解釋

下述代碼的目標(biāo):

deploy/samza/bin/run-job.sh --config-factory=org.apache.samza.config.factories.PropertiesConfigFactory --config-path=file://$PWD/deploy/samza/config/wikipedia-feed.properties

要部署一個(gè)聽(tīng) Wi-Fi API 的 Samza 工作,可以實(shí)時(shí)獲取 Feed,并生成 Kafka 主題維基百科的源文件。本教程中的替代方法是在無(wú)限循環(huán)中閱讀本地維基百科 Feed,并將數(shù)據(jù)生成給 Kafka維基百科。后續(xù)工作,維基百科解析器正在從 Kafka 主題維基百科原始獲取數(shù)據(jù),所以只要我們?cè)?Kafka 主題維基百科原始中有正確的數(shù)據(jù),就可以。所有 Samza 的工作由 Kafka 連接,不依賴(lài)于彼此。

以上內(nèi)容是否對(duì)您有幫助:
在線(xiàn)筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)