Find Jobs
Hire Freelancers

Content Scrapper - Aggregator(repost)

$100-500 USD

完了済み
投稿日: 約15年前

$100-500 USD

完了時にお支払い
We are a team of engeneers, specialized in SEO consulting. The goal is to **crawl** blogs and forums and **save** their content into a database. ## Deliverables ## Going to the data A list of blogs will be given. Each will need to be crawled throught it's archives, and every article taken. Also, sometimes a search result page will be given, and you have to open the results, as new blogs to crawl. A list of forums (phpBB mostly) will be given. With a login and password. You will need to get the topics and translate them as articles. The first post in the topic is the "content", the others are the "comments". A list of usenet newsgroups will be given. You will get their messages, through google group, or a news system (NNRP access) Each first post is an article, it's answers are comments. In all cases, an article that is less that X characters long won't be downloaded. ## ## Getting data Each article in a blog will be a new row in the main table. You may also create other tables as needed. If you think a table with a row for each blog can be useful, do it. Main table fields : * id primary key auto intrement <!-- --> * title * content <- whole article, not whole web page * date of release of article * source url <- also used as UNIQUE , so if we crawl the site again, don't take the same article 2 times * tags (if any) (<- separate table?) * categories (if any) (<- separate table?) * user comments (in separate table) : nickname, date, content * images if article got any. Will be put in a dir which name is the id field. Images can be taken with system("wget ...") ## ## Technical Name of table, of class(es) to use and some downloading functions are pre-defined or will be changed. Each blog , or blog platform will be different to parse obviously. You can decide to write parsing information in a table, or in the code, as you wish.
プロジェクト ID: 3862247

プロジェクトについて

12個の提案
リモートプロジェクト
アクティブ 15年前

お金を稼ぎたいですか?

Freelancerで入札する利点

予算と期間を設定してください
仕事で報酬を得る
提案をご説明ください
登録して仕事に入札するのは無料です
アワード者:
ユーザーアバター
See private message.
$425 USD 20日以内
4.9 (27 レビュー)
4.7
4.7
この仕事に12人のフリーランサーが、平均$324 USDで入札しています
ユーザーアバター
See private message.
$369.75 USD 20日以内
5.0 (70 レビュー)
5.9
5.9
ユーザーアバター
See private message.
$263.50 USD 20日以内
4.9 (99 レビュー)
5.1
5.1
ユーザーアバター
See private message.
$94.35 USD 20日以内
4.2 (16 レビュー)
5.0
5.0
ユーザーアバター
See private message.
$403.75 USD 20日以内
5.0 (4 レビュー)
4.7
4.7
ユーザーアバター
See private message.
$297.50 USD 20日以内
4.5 (26 レビュー)
4.2
4.2
ユーザーアバター
See private message.
$191.25 USD 20日以内
4.7 (11 レビュー)
3.3
3.3
ユーザーアバター
See private message.
$425 USD 20日以内
4.5 (5 レビュー)
2.6
2.6
ユーザーアバター
See private message.
$351.05 USD 20日以内
0.5 (1 レビュー)
0.8
0.8
ユーザーアバター
See private message.
$382.50 USD 20日以内
0.0 (0 レビュー)
0.0
0.0
ユーザーアバター
See private message.
$340 USD 20日以内
0.0 (0 レビュー)
0.0
0.0
ユーザーアバター
See private message.
$340 USD 20日以内
0.0 (0 レビュー)
2.0
2.0

クライアントについて

BULGARIAのフラグ
SOFIA, Bulgaria
5.0
5
メンバー登録日:1月 17, 2008

クライアント確認

ありがとうございます!無料クレジットを受け取るリンクをメールしました。
メールを送信中に問題が発生しました。もう一度お試しください。
登録ユーザー 投稿された仕事の合計
Freelancer ® is a registered Trademark of Freelancer Technology Pty Limited (ACN 142 189 759)
Copyright © 2024 Freelancer Technology Pty Limited (ACN 142 189 759)
プレビューを読み込み中
位置情報へのアクセスが許可されました。
あなたのログインセッションの有効期限がきれ、ログアウトされました。もう一度ログインしてください。