程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> PHP綜合 >> 在php中使用sockets:從新聞組中獲取文章

在php中使用sockets:從新聞組中獲取文章

編輯:PHP綜合

PHP能打開遠程或本地主機上的Socket端口。本文是一個使用Socket的小例子:連接到一個Usenet新聞組服務器,同服務器對話,從新聞組中下載一些文章。


在php中打開一個socket
使用fsockopen()打開一個socket.這個函數在php3和php4種都可以使用。函數聲明是這樣的:


int fsockopen (string hostname, int port _
[, int errno [, string errstr [, double timeout]]])

 
這個函數將打開一個連接到主機hostname的port端口的TCP連接。hostname可以是一個有效的域名,或者是一個ip地址。對於udp連接,你必須指定協議:udp://hostname. 對於unix域,主機名使用到socket的路徑,這種情況下,端口port必須置為0。可選的timeout參數用來設定等待打開一個socket的時間,單位為秒。


關於fsockopen()的更多信息,請參考:http://www.php.net/manual/function.fsockopen.php


網絡新聞傳輸協議
   訪問新聞組服務器需要通過稱為NNTP(網絡新聞傳輸協議)的協議來進行。這個協議在rfc977中有詳細的細節,可以在http://www.w3.org/Protocols/rfc977/rfc977.html得到。這個文檔分別描述了怎樣連接到NNTP服務器,怎樣同服務器對話,以及完成這些任務的不同命令。


連接
   連接到一個NNTP服務器需要知道它的主機名(或者是ip地址)和它偵聽的端口。為了避免一個連接企圖失敗導致程序掛起,你應該使用timeout參數。
    <?php
      $cfgServer   = "your.news.host";
      $cfgPort     = 119;
      $cfgTimeOut  = 10;

      //open a socket
      if(!$cfgTimeOut)
         // without timeout
         $usenet_handle = fsockopen($cfgServer, $cfgPort);
      else
         // with timeout
         $usenet_handle = fsockopen($cfgServer, $cfgPort, &$errno, &$errstr, $cfgTimeOut);

      if(!$usenet_handle) {
          echo "Connection failed.\n";
          exit();
      }
      else {
          echo "Connected.\n";
          $tmp = fgets($usenet_handle, 1024);
      }

?>
與服務器對話

現在我們已經連接到了服務器,可以通過前面打開的socket同服務器對話了。比如說我們要從某個新聞組得到最近的10篇文章。RFC977指出,第一步要用GROUP命令選擇正確的新聞組:
GROUP ggg
參數ggg是要選擇的新聞組的名字(比如說是"net.news"),這是必需的。可用的新聞組的列表可以用LIST命令得到。選擇新聞組的命令成功後,返回組中第一篇和最後一篇文章的文章編號,以及組中文章的數目。
   

下面是一個例子:
    chrome:~$ telnet my.news.host 119
    Trying aa.bb.cc.dd...
    Connected to my.news.host.
    Escape character is '^]'.
    200 my.news.host InterNetNews NNRP server INN 2.2.2 13-Dec-1999 ready (posting ok).
    GROUP alt.test
    211 232 222996 223235 alt.test
    quit
    205 .

    接收到命令 GROUP alt.test 後,服務器返回"211 232 222996 223235 alt.test". 211是RFC中定義的返回碼,指示命令已成功執行。返回信息還指出,現在有232篇文章,最早的文章的編號是222996,最新的文章的編號是223235。我們看到,222996+232並不等於223235。丟失的7篇文章因為某種原因被從服務器刪除了,可能是因為被它的合法作者取消了(這是可能的,而且很容易做到),或者因為是灌水文章而被刪。
   

需要注意的事,有些服務器在選擇新聞組之前可能要求身份認證,這取決於這是一個公共的或者是私用的服務器。也有可能服務器允許任何人讀取文章,但發表文章需要身份驗證。

    <?php

      //$cfgUser    = "xxxxxx";
      //$cfgPasswd  = "yyyyyy";
      $cfgNewsGroup = "alt.php";

      //identification required on private server
      if($cfgUser) {
          fputs($usenet_handle, "AUTHINFO USER ".$cfgUser."n");
          $tmp = fgets($usenet_handle, 1024);
          fputs($usenet_handle, "AUTHINFO PASS ".$cfgPasswd."n");
          $tmp = fgets($usenet_handle, 1024);

          //check error

          if($tmp != "281 Okrn") {
              echo "502 Authentication errorn";
              exit();
          }
  }

  //select newsgroup

  fput($usenet_handle, "GROUP ".$cfgNewsGroup."n");
  $tmp = fgets($usenet_handle, 1024);

  if($tmp == "480 Authentication required for commandrn") {
     echo $tmp;
     exit();
  }

  $info = split(" ", $tmp);
  $first= $info[2];
  $last = $info[3];

  printf("First : %sn", $first);
  printf("Last : %lastn", $last);

?>

 

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved