数据采集,又称数据获取,是利用一种装置,从系统外部采集数据并输入到系统内部的一个接口。数据采集技术广泛应用在各个领域。比如摄像头,麦克风,都是数据采集工具。
被采集数据是已被转换为电讯号的各种物理量,如温度、水位、风速、压力等,可以是模拟量,也可以是数字量。采集一般是采样方式,即隔一定时间(称采样周期)对同一点数据重复采集。采集的数据大多是瞬时值,也可是某段时间内的一个特征值。准确的数据测量是数据采集的基础。数据量测方法有接触式和非接触式,检测元件多种多样。不论哪种方法和元件,均以不影响被测对象状态和测量环境为前提,以保证数据的正确性。数据采集含义很广,包括对面状连续物理量的采集。在计算机辅助制图、测图、设计中,对图形或图像数字化过程也可称为数据采集,此时被采集的是几何量(或包括物理量,如灰度)数据。
在互联网行业快速发展的今天,数据采集已经被广泛应用于互联网及分布式领域,数据采集领域已经发生了重要的变化。首先,分布式控制应用场合中的智能数据采集系统在国内外已经取得了长足的发展。其次,总线兼容型数据采集插件的数量不断增大,与个人计算机兼容的数据采集系统的数量也在增加。国内外各种数据采集机先后问世,将数据采集带入了一个全新的时代。
以下是一个数据采集类
<? // 兼容 php4 php5 // 简单调用方法 /* <? include ("ugs.php"); // 你可以下载本ugs.phps 然后重命名为ugs.php $ugs = new ugs(); $url = "http://domainname.com/path_to_your_target?param"; $ugs->seturl($url); $ugs->gather(); //............这里可以调用本类里的其它方法,对$ugs->value_ 做调整, 以满足您的要求 $content=$ugs->getcontent(); print($content); ?> */ class ugs { var $value_ ; //'目标内容 var $src_ ; //'目标URL地址 function seturl($url) { $this->src_=$url; } function getcontent() { return $this->value_; } function getfile($url) // 获取目标 { $url_parsed = parse_url($url); $host = $url_parsed["host"]; $port = $url_parsed["port"]; if ($port==0) $port = 80; $path = $url_parsed["path"]; if (empty($path)) $path="/"; if ($url_parsed["query"] != "") $path .= "?".$url_parsed["query"]; $out = "GET $path HTTP/1.0\r\nHost: $host\r\n\r\n"; $fp = fsockopen($host, $port, $errno, $errstr, 30); fwrite($fp, $out); $body = false; while (!feof($fp)) { $s = fgets($fp, 1024); if ( $body ) $in .= $s; if ( $s == "\r\n" ) $body = true; } fclose($fp); return $in; } function getfile_curl($url) { $curl="/usr/local/bin/curl " ; // path to your curl $curl_options=" -s --connect-timeout 10 --max-time 10 "; // curl 用法请参考 curl --help 或者 man curl // curl 参数非常之丰富,可以模拟各种浏览器(agent) 可以设置referer $cmd="$curl $curl_options $url "; @exec($cmd,$o,$r); if($r!=0) { return "超时"; } else { $o=join("",$o); return $o; } } function gather_curl($curl) { $http=$this->getfile_curl($this->src_); return $this->value_=$http; } function gather_array($url) { return file($url); } function gather() // 开始收集 { $http=$this->getfile($this->src_); return $this->value_=$http; } function gather_local($toline=true) // 处理本地文件 { if($toline) { $http=file($this->src_); return $this->value_=$this->BytesToBstr($http); } else { $http=file($this->src_); return $this->value_=$http; } } function noReturn() // 删除回车换行 { $this->value_=str_replace("\n","",$this->value_); $this->value_=str_replace("\r","",$this->value_); } function change($oldStr,$str) //'对收集到的内容中的个别字符串用新值更换/方法 //'参数分别是旧字符串,新字符串 { $this->value_=str_replace($oldStr,$str,$this->value_ ); } function cut($start,$end,$no='1',$comprise='') //'按指定首尾字符串对收集的内容进行裁减(不包括首尾字符串)方法 // $no 必须是 1,2 3 ... 不允许是0 //$comprise 可以选择 start 或者 end 或者 all 或者 什么都不填 { $string=explode($start,$this->value_); //print_r($string); $string=explode($end,$string[$no]); //print_r($string); switch ($comprise){ case 'start': $string=$start.$string[0]; break; case 'end': $string=$string[0].$end; break; case 'all': $string=$start.$string[0].$end; break; default: $string=$string[0]; } return $this->value_=$string; } function filt($head,$bot,$str,$no='1',$comprise='') //'按指定首尾字符串对收集的内容用新值进行替换(不包括首尾字符串)方法 // '参数分别是首字符串,尾字符串,新值,新值位空则为过滤 { $tmp_v=$this->value_; $tmp=$this->cut($head,$bot,$no,$comprise); return $this->value_=str_replace($tmp,$str,$tmp_v); } function local() { //'将收集的内容中的绝对URL地址改为本地相对地址 // 还没实现 } function replaceByReg($patrn,$str) //'对收集的内容中的符合正则表达式的字符串用新值进行替换/方法 //'参数是你自定义的正则表达式,新值 { return $this->value_=join("",preg_replace($patrn,$str,$this->value_)); } function debug() //调试显示 { $tempstr="<SCRIPT>function runEx(){var winEx2 = window.open(\"\", \"winEx2\", \"width=500,height=300,status=yes,menubar=no,scrollbars=yes,resizable=yes\"); winEx2.document.open(\"text/html\", \"replace\"); winEx2.document.write(unescape(event.srcElement.parentElement.children[0].value)); winEx2.document.close(); }function saveFile(){var win=window.open('','','top=10000,left=10000');win.document.write(document.all.asdf.innerText);win.document.execCommand('SaveAs','','javascript.htm');win.close();}</SCRIPT><center><TEXTAREA id=asdf name=textfield rows=32 wrap=VIRTUAL cols=\"120\">".$this->value_."</TEXTAREA><BR><BR><INPUT name=Button onclick=runEx() type=button value=\"查看效果\"> <INPUT name=Button onclick=asdf.select() type=button value=\"全选\"> <INPUT name=Button onclick=\"asdf.value=''\" type=button value=\"清空\"> <INPUT onclick=saveFile(); type=button value=\"保存代码\"></center>"; echo $tempstr; } } ?>
Atas ialah kandungan terperinci php 一个数据采集类实例代码. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!