Find Jobs
Hire Freelancers

Java Scraping - Extracting Content From The Page

$30-250 USD

クローズ
投稿日: 11年以上前

$30-250 USD

完了時にお支払い
We are looking for a PoC app showing how to extract main content from the random html page, stripping everything else out (navigation, banners, sides, etc) . Similar to what instapaper does with random content page. I have attached list of random html pages covering similar topic, result application should intelligently extract only main content from the page. !!! To be considered for the job, please outline general direction you would take
プロジェクト ID: 4188123

プロジェクトについて

5個の提案
リモートプロジェクト
アクティブ 11年前

お金を稼ぎたいですか?

Freelancerで入札する利点

予算と期間を設定してください
仕事で報酬を得る
提案をご説明ください
登録して仕事に入札するのは無料です
この仕事に5人のフリーランサーが、平均$220 USDで入札しています
ユーザーアバター
Hi sir, please check PM, thx Kimi.
$250 USD 5日以内
4.9 (65 レビュー)
6.1
6.1
ユーザーアバター
Scraping Experts Here. Check the message and contact us. Scraping samples are also attached.
$250 USD 10日以内
3.5 (15 レビュー)
5.3
5.3
ユーザーアバター
Hi, Ready to start your work. Eagerly awaiting for your positive reply. Please check your inbox for further details. Thanks, Shaik.
$250 USD 3日以内
5.0 (22 レビュー)
4.9
4.9
ユーザーアバター
I can complete your project perfectly, please check PMB for more details....................Thanks..
$200 USD 7日以内
5.0 (18 レビュー)
4.9
4.9
ユーザーアバター
I have something that will work for this.
$100 USD 1日以内
5.0 (1 レビュー)
1.6
1.6
ユーザーアバター
1) Will the program download the content or not or you have something already doing the download? Just wanted to know 2) The way you go about doing this is use URLConnection to download if you want to download the page 3) Then you need to use HTML to XML convert API. There are many libraries that do a good job of this but some pages might throw error while parsing because they cannot be parsed properly - likelywood less or even 0. But you have to rely on the library - you have no choice. Then apply XSL to convert to XML to another XML that is more readable (Or maybe this is not needed - depends on you - Lets' not complicate unnecessarily ). Then you use java program to read the XML data out. For this price or infact any price, you can get a framework that can parse one page. Then you have to learn how to construct the XSLT. I can teach you for an hour or so but it is up to you to learn..Or else no program will do any good.
$300 USD 3日以内
0.0 (0 レビュー)
0.0
0.0

クライアントについて

CANADAのフラグ
Toronto, Canada
5.0
15
お支払い方法確認済み
メンバー登録日:7月 16, 2009

クライアント確認

ありがとうございます!無料クレジットを受け取るリンクをメールしました。
メールを送信中に問題が発生しました。もう一度お試しください。
登録ユーザー 投稿された仕事の合計
Freelancer ® is a registered Trademark of Freelancer Technology Pty Limited (ACN 142 189 759)
Copyright © 2024 Freelancer Technology Pty Limited (ACN 142 189 759)
プレビューを読み込み中
位置情報へのアクセスが許可されました。
あなたのログインセッションの有効期限がきれ、ログアウトされました。もう一度ログインしてください。