84669 人學習
152542 人學習
20005 人學習
5487 人學習
7821 人學習
359900 人學習
3350 人學習
180660 人學習
48569 人學習
18603 人學習
40936 人學習
1549 人學習
1183 人學習
32909 人學習
遇到一个比较棘手的需求:
开发语言Java;
程序定时读取HR邮箱中从前程无忧,智联发过来的简历(已实现,获到简历的HTML);
从简历HTML中解析获取想要的信息想(姓名,性别,电话,邮箱,工作经历,教育经历等等),保存到数据库中;
把数据库中的简历数据用HTML展示,可让HR进行筛选;
我现在卡在了简历HTML的解析信息这步,我用比较笨的方法,字符串定位截取,但是这样没办法比较准确的获取到想要信息。。。求助大家,看有没有好方法解析。。
還是用Jsoup 轉成 對應的 Document對象,在操作對應元素方便點。jsoup API:http://www.open-open.com/jsoup/
用正規表示式呢?多考慮一些可能的匹配格式,應該可以。
用正規捕獲會好點吧
可以用 jsoup
可以用JSOUP 之前做過一個類似的東西,這個很方便的,可以對各種標籤什麼的進行處理。
優先選擇jsoup。jsoup有個select功能,類似CSS的選擇器的語法,API又簡潔,比正規表示式方便。
1 正規2 HTML解析庫,中文貌似叫「秘銀」
還是用Jsoup 轉成 對應的 Document對象,在操作對應元素方便點。
jsoup API:http://www.open-open.com/jsoup/
用正規表示式呢?多考慮一些可能的匹配格式,應該可以。
用正規捕獲會好點吧
可以用 jsoup
可以用JSOUP 之前做過一個類似的東西,這個很方便的,可以對各種標籤什麼的進行處理。
優先選擇jsoup。
jsoup有個select功能,類似CSS的選擇器的語法,API又簡潔,比正規表示式方便。
1 正規
2 HTML解析庫,中文貌似叫「秘銀」