在 php 中使用 sockets:從新聞組中取得文章
發(fā)表時間:2024-06-21 來源:明輝站整理相關(guān)軟件相關(guān)文章人氣:
[摘要]PHP能打開遠程或本地主機上的Socket端口。本文是一個使用Socket的小例子:連 接到一個Usenet新聞組服務(wù)器,同服務(wù)器對話,從新聞組中下載一些文章。 在php中打開一個socket 使用fsockopen()打開一個socket.這個函數(shù)在php3和php4種都可以使用。函數(shù)聲明 是這...
PHP能打開遠程或本地主機上的Socket端口。本文是一個使用Socket的小例子:連
接到一個Usenet新聞組服務(wù)器,同服務(wù)器對話,從新聞組中下載一些文章。
在php中打開一個socket
使用fsockopen()打開一個socket.這個函數(shù)在php3和php4種都可以使用。函數(shù)聲明
是這樣的:
int fsockopen (string hostname, int port [, int errno [, string errstr [, double timeout]]])
這個函數(shù)將打開一個連接到主機hostname的port端口的TCP連接。hostname可以是一
個有效的域名,或者是一個ip地址。對于udp連接,你必須指定協(xié)議:udp://hostname.
對于unix域,主機名使用到socket的路徑,這種情況下,端口port必須置為0?蛇x
的timeout參數(shù)用來設(shè)定等待打開一個socket的時間,單位為秒。
關(guān)于fsockopen()的更多信息,請參考:h
ttp://www.php.net/manual/function.fsockopen.php
網(wǎng)絡(luò)新聞傳輸協(xié)議
訪問新聞組服務(wù)器需要通過稱為NNTP(網(wǎng)絡(luò)新聞傳輸協(xié)議)的協(xié)議來進行。這個協(xié)議
在rfc977中有詳細的細節(jié),可以在http://www.w3.org/Protocols/rfc977/rfc977.html
得到。這個文檔分別描述了怎樣連接到NNTP服務(wù)器,怎樣同服務(wù)器對話,以及完成這
些任務(wù)的不同命令。
連接
連接到一個NNTP服務(wù)器需要知道它的主機名(或者是ip地址)和它偵聽的端口。為了
避免一個連接企圖失敗導(dǎo)致程序掛起,你應(yīng)該使用timeout參數(shù)。
<?php
$cfgServer = "your.news.host";
$cfgPort = 119;
$cfgTimeOut = 10;
//open a socket
if(!$cfgTimeOut)
// without timeout
$usenet_handle = fsockopen($cfgServer, $cfgPort);
else
// with timeout
$usenet_handle = fsockopen($cfgServer, $cfgPort, &$errno, &$errstr, $cfgTimeOut);
if(!$usenet_handle) {
echo "Connection failed.n";
exit();
}
else {
echo "Connected.n";
$tmp = fgets($usenet_handle, 1024);
}
?>
與服務(wù)器對話
現(xiàn)在我們已經(jīng)連接到了服務(wù)器,可以通過前面打開的socket同服務(wù)器對話了。比如
說我們要從某個新聞組得到最近的10篇文章。RFC977指出,第一步要用GROUP命令選擇
正確的新聞組:
GROUP ggg
參數(shù)ggg是要選擇的新聞組的名字(比如說是"net.news"),這是必需的。可用的新
聞組的列表可以用LIST命令得到。選擇新聞組的命令成功后,返回組中第一篇和最
后一篇文章的文章編號,以及組中文章的數(shù)目。
下面是一個例子:
chrome:~$ telnet my.news.host 119
Trying aa.bb.cc.dd...
Connected to my.news.host.
Escape character is '^]'.
200 my.news.host InterNetNews NNRP server INN 2.2.2 13-Dec-1999 ready (posting ok).
GROUP alt.test
211 232 222996 223235 alt.test
quit
205 .
接收到命令 GROUP alt.test 后,服務(wù)器返回"211 232 222996 223235 alt.test".
211是RFC中定義的返回碼,指示命令已成功執(zhí)行。返回信息還指出,現(xiàn)在有232篇文
章,最早的文章的編號是222996,最新的文章的編號是223235。我們看到,
222996+232并不等于223235。丟失的7篇文章因為某種原因被從服務(wù)器刪除了,可能
是因為被它的合法作者取消了(這是可能的,而且很容易做到),或者因為是灌水文
章而被刪。
需要注意的事,有些服務(wù)器在選擇新聞組之前可能要求身份認證,這取決于這是一個
公共的或者是私用的服務(wù)器。也有可能服務(wù)器允許任何人讀取文章,但發(fā)表文章需要
身份驗證。
<?php
//$cfgUser = "xxxxxx";
//$cfgPasswd = "yyyyyy";
$cfgNewsGroup = "alt.php";
//identification required on private server
if($cfgUser) {
fputs($usenet_handle, "AUTHINFO USER ".$cfgUser."n");
$tmp = fgets($usenet_handle, 1024);
fputs($usenet_handle, "AUTHINFO PASS ".$cfgPasswd."n");
$tmp = fgets($usenet_handle, 1024);
//check error
if($tmp != "281 Okrn") {
echo "502 Authentication errorn";
exit();
}
}
//select newsgroup
fput($usenet_handle, "GROUP ".$cfgNewsGroup."n");
$tmp = fgets($usenet_handle, 1024);
if($tmp == "480 Authentication required for commandrn") {
echo $tmp;
exit();
}
$info = split(" ", $tmp);
$first= $info[2];
$last = $info[3];
printf("First : %sn", $first);
printf("Last : %lastn", $last);
?>