面向对象方法课留了个作业,使用EJB实现一个简单的东东,从而更深刻的体会EJB组件。虽然J2EE学了不少,但正统的EJB一直没有怎么看。今天大体看了看EJB3.0,感觉EJB3.0在易用方面的确有很大的改进。曾经以极高的复杂性的EJB,现在和Spring、Hibernate这些轻量级的解决方案相比已经差不了哪去了,EJB在轻量化,所有的Bean都可以是POJO的,只需要使用注解表明是Entity bean,Stateless/Stateful Session bean,Message-driven bean,Remote/Local接口,不需要 ...
Egothor
Egothor是一个用Java编写的开源而高效的全文本搜索引擎。借助Java的跨平台特性,Egothor能应用于任何环境的应用,既可配置为单独的搜索引擎,又能用于你的应用作为全文检索之用。
更多Egothor信息
Nutch
Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。
更多Nutch信息
Lucene
Apache Lucene是一个基于Java全文搜索引擎,利用它 ...
- 00:09
- 浏览 (93)
- 评论 (0)
- 分类: Search Engine
前几天看了徐老师写的谈谈学习动态脚本语言对搞web mining研究的必要性,想起上次英语课话剧,使用ruby一行代码完成任务的事,深刻体会到动态语言的简洁强大之处,对处理文本的方便之处。开始剧本中是为了更好的理解剧情,中英文混在一起的,后来剧情比较熟了,为了看台词方便,希望把英语提取出来,我们这组幸好有我是计算机出身的,否则得花一晚上手工完成了。
格式类似如下:
引用
在一旁看的七濑美雪以被打败的表情说话:「都是因为阿一你擅自在滑雪练习场之外的地方下来,所以才会变成这样啊。」 That's all because you had to go beyond the training grou ...
这个学期从图书馆借了两本Unix/Linux编程的E文书,《Advanced Programming in the Unix Enviornment》(传说中的Unxi圣经级别的书简称APUE)和《Unix System Programming》。大体快看了一半,书这东东,看的快忘的也快,David同学笔记做得很好,很值得借鉴,现在也打算写写笔记。感觉操作系统这东东,好好学学的确很有必要,本科的时候操作系统的原理倒学了不少,当时老师没有推荐一本Unix/Linux的书籍看看,感觉很是可惜。现在同学中不少使用Ubuntu的,受其良好的熏陶,现在基本可以在Ubuntu下混了。
以前看过英文版的若干个章节,Hibernate之父亲自执笔,感觉写的相当不错,同学实验室要买书,刚好出了中文版的,推荐了这本,现在在我手里,可以准备好好看看,很厚的一本书,翻译过来才600多页,有点出乎我的意料了,有阿敏司令把关,相信翻译水平应该不错。
前几天用java写了一个GUI的搜索下载工具,主要利用baidu mp3搜索的结果。david同学用perl写了命令行的类似的下载工具,为了练练ruby,我又写了ruby版的。
Fetcher类:
根据url来Fetch到页面,供Parser分析之用
require "net/http"
class Fetcher
def fetch(url)
host = url.scan(/\/\/(.*?)\//m)[0][0]
path = url.split(/#{host}\//)[1]
# print "host: ",host,"\n" ...
我使用open-uri来下载文件:
require 'open-uri'
url = "http://www.union-ms.com/wenj/2005628171127.mp3"
open(url) do |fin|
size = fin.size
download_size = 0
puts "size: #{size}"
filename = url[url.rindex('/')+1, url.length-1]
puts "name: #{filename}"
open(File.basename("./#{filename}")," ...
一个简单的RSS Reader其实很好写,或许根本不需要使用SSH2这把牛刀,使用jsp+servlet+javabean会变得及其简单,很快就可以搞定。其实这个
是面试实习生后的一个homework,所以尽量使用更多的技术,当
然也没要求必须的做,现在做的差不多了,不过在给我offer之前,貌似没
有地方拿给他们看了,还是弄到博客上吧。使用了sun的rome操作RSS.
lib太多了,附件放不下,.war文件都20多M,所以只把源代码放上,需要自己导入
spring2.0,hibernate3.2,struts2,rome,mysql-connector-java-5.1.5-bin.ja相 ...
主要是利用baidu搜索的到的结果,然后从页面中抽取歌曲的链接和与歌曲相关的其他信息,
然后利用这些链接进行下载.
感觉实用性还挺强的,虽然下载速度和迅雷没法比,貌似比直接下载.
Matcher类:
使用Matcher类,最重要的一个概念必须清楚:组(Group),在正则表达式中
()定义了一个组,由于一个正则表达式可以包含很多的组,所以下面先说说怎么划分组的,
以及这些组和组的下标怎么对应的.
下面我们看看一个小例子,来说明这个问题
引用\w(\d\d)(\w+)
这个正则表达式有三个组:
整个\w(\d\d)(\w+) 是第0组 group(0)
(\d\d)是第1组 group(1)
(\w+)是第2组 group(2)
我们看看和正则表达式匹配的一个字符串x99SuperJava,
group(0)永远都是匹配整个表达式的字符串的那部分x99SuperJava ...
- 浏览: 50199 次
- 性别:

- 来自: 长春

- 详细资料
搜索本博客
我的相册
RSS Reader1
共 6 张
共 6 张
链接
最新评论
-
使用Struts2+Spring+Hiber ...
不过整个工程都没有一条注释啊。。。 这个比较郁闷,万一以后你写了个框架,那下面 ...
-- by yyphzc -
使用Struts2+Spring+Hiber ...
总体感觉还行,不过部分代码需要优化为好 1.DAO既然使用泛型,那就干脆点。想想 ...
-- by yeshucheng -
使用Struts2+Spring+Hiber ...
这儿有个好同志: http://www.javaeye.com/topic/12 ...
-- by drinkjava -
写了一个支持搜索并下载歌 ...
为什么要配置成legal_music_link=http://202.108.2 ...
-- by nini -
写了一个支持搜索并下载歌 ...
引用研究了下也没弄成..命令行编译也好,用MyEclipse也好..也改了那三个 ...
-- by fuliang






评论排行榜