84669 orang belajar
152542 orang belajar
20005 orang belajar
5487 orang belajar
7821 orang belajar
359900 orang belajar
3350 orang belajar
180660 orang belajar
48569 orang belajar
18603 orang belajar
40936 orang belajar
1549 orang belajar
1183 orang belajar
32909 orang belajar
遇到一个比较棘手的需求:
开发语言Java;
程序定时读取HR邮箱中从前程无忧,智联发过来的简历(已实现,获到简历的HTML);
从简历HTML中解析获取想要的信息想(姓名,性别,电话,邮箱,工作经历,教育经历等等),保存到数据库中;
把数据库中的简历数据用HTML展示,可让HR进行筛选;
我现在卡在了简历HTML的解析信息这步,我用比较笨的方法,字符串定位截取,但是这样没办法比较准确的获取到想要信息。。。求助大家,看有没有好方法解析。。
还是用Jsoup 转成 相应的 Document对象,在操作对应元素方便点。jsoup API:http://www.open-open.com/jsoup/
用正则表达式呢?多考虑一些可能的匹配格式,应该可以。
用正则捕获会好点吧
可以用 jsoup
可以用JSOUP 之前做过一个类似的东西,这个很方便的,可以对各种标签什么的进行处理。
优先选择jsoup。jsoup有个select功能,类似于CSS的选择器的语法,API又简洁,比正则表达式方便。
1 正则2 HTML解析库,中文貌似叫“秘银”
还是用Jsoup 转成 相应的 Document对象,在操作对应元素方便点。
jsoup API:http://www.open-open.com/jsoup/
用正则表达式呢?多考虑一些可能的匹配格式,应该可以。
用正则捕获会好点吧
可以用 jsoup
可以用JSOUP 之前做过一个类似的东西,这个很方便的,可以对各种标签什么的进行处理。
优先选择jsoup。
jsoup有个select功能,类似于CSS的选择器的语法,API又简洁,比正则表达式方便。
1 正则
2 HTML解析库,中文貌似叫“秘银”