Mahout Machine Learning Project Launches Mahout 기계 학습 프로젝트 시작 어제 포스팅했던 Lucene의 서브 프로젝트로 Mahout 기계 학습 프로젝트가 런칭되었다고 합니다. 베이지안, 뉴럴넷, kmean클러스터링, 벡터 머신과 같은 기술을 구현하는 것으로 진행이 될 듯 하네요. 대용량 데이터를 다루는데 사용되는 Hadoop 프로젝트의 프로그램을 이용한다고 합니다. 홈페이지 메인에 링크된 논문을 읽어보니 멀티코어 프로세서를 이용한 기계학습 알고리즘을 구현하려는 듯 합니다. 멀티코어 프로세서가 확대되고 있는 이 시점에 딱 어울리는 작업이란 생각이 드네요. 커뮤니티 형성을 도와줄 지원자들이 필요하다고 하니 이런 인공지능쪽 지식이 있는 분들은 관심있게 봐 주시면 좋을 듯 ..
Lucene Java 2.3.0 released! 루씬 자바 2.3.0 공개! 요즘 관심있는 프로젝트들이 새 버전들을 내놓고 있네요. 루씬의 가장 중요한 프로젝트인 루씬 자바의 마이너 버전 업데이트가 있었습니다. 2007년 6월에 2.2 버전이 발표되고 반 년 정도 지났군요. 루 씬은 오픈소스 검색 프로젝트입니다. 복잡하고 어려운 수많은 기술들의 집합체인 인덱싱과 검색 기술을 모아 오픈소스로 내놓다니 정말 대단하죠. 여러 곳에서 다양한 방법으로 활용되고 있다고 합니다. 한글 서적으로는 오래전에 Lucene in action책이 발매되어 있습니다. 요즘 이 책을 보면서 공부하고 있는 중인데 재미있습니다. 루씬은 규모가 꽤 있는 프로젝트라서 다양한 서브 프로젝트를 가지고 있습니다. 기본적으로 루씬은 자바 언..
Apache Commons IO 1.4 Released 아파치 커먼즈 IO 1.4 공개 Apache Commons IO의 1.4 버전이 공개되었습니다. IO 를 다루는 문제는 언제나 골치가 아픕니다. 챙겨줄 것도 많고 자칫하면 퍼포먼스 저하의 주범이 되어버리니까요. Apache Commons IO는 이런 문제들을 간단히 해결해 주는 라이브러리 입니다. 자바에서 제공하는 네이티브 파일관리 라이브러리보다 단순한 인터페이스를 제공해 주기 때문에 실수할 수 있는 여지를 줄여주며 자체적으로 향상된 스트림 처리와 같은 기능을 제공하고 있습니다. 여러 프레임워크들도 이 라이브러리를 활용하여 만들어 지고 있습니다. 몇가지 좋은 예제를 들자면... (홈페이지의 사용자 가이드에서 가져왔습니다.) InputStream in..
자카르타의 서브 프로젝트였던 Commons 의 서브프로젝트인 Pool의 새 버전이 나왔네요~ '다양한 객체(Object)들의 재 사용을 위한 풀(Pool)을 관리하는 라이브러리' 라고 보시면 되겠습니다. 자카르타의 서브 프로젝트 출신 답게 자바 언어로 되어있지요. 아시겠지만 '풀'이라는 것은 객체의 생성과 삭제에 드는 자원 소모가 많으니 다쓰고 죽이지 말고, 재활용 해 보자는 마인드입니다. 데이터베이스 연결 같은 부분에 많이 쓰이고 있죠. 이번 버전의 내용은, 버그를 많이 해결해 안정적이 되었고 인터페이스의 모호성을 줄이고 쓰임새를 높이기 위해 메소드들을 좀 고쳤지만, 이전 버전과도 호환을 유지한다고 하네요. 소스를 보는 것도 공부하는데 좋겠습니다. 내부를 까보지는 않았지만 자바독을 훑어보니 클래스 구조..
가수 아이비가 아닙니다^^ Apache Ivy 프로젝트 홈 http://ant.apache.org/ivy/ 이번에 소개하는 것은 "아이비"라는 프로젝트입니다. 얼마 전, 인큐베이터에 속해있다가 아파치 앤트의 서브 프로젝트로 승격되었구요, 2.0.0-beta1 버전이 릴리즈 되었습니다. 요즘은 다양한 프레임워크를 엮어 나아가는 쪽으로 개발 되는것이 보통이므로, 어떤 프레임워크를 쓰는지 관리하는 것이 힘들어지고 있습니다. 이런 관리를 도와주는 역할을 합니다. 앤트 빌드파일에 셋팅된 정보를 이용하여 각 라이브러리를 참조한 뒤 종속성(의존성) 검사를 수행합니다. 수행한 결과는 텍스트와 예쁘게 꾸며진 HTML 화면으로도 제공됩니다. 아래 스크린 샷은 공식 홈에서 가져온 것 입니다. 아래 링크는 리포트의 예제로, ..