Se requiere un software de Web Scraping que extraiga de uno o más sitios específicos la siguiente información: Número de teléfono, Dirección, Nombre de empresa o de sitio y Categoría. La información resultante debe quedar ya sea en una base de datos, o en un archivo plano. El target principal es el de teléfonos de Colombia, por lo que el desarrollador debería revisar y acomodarse a los formatos de teléfonos en Colombia. Algunas veces tendrán el prefijo de Colombia que es el 57, por ejemplo los números de celular comienzan por 310, 311, 312 y tienen 10 dígitos, en fin, el desarrollador debería estudiar las diferentes combinaciones y formatos de teléfonos de Colombia. La idea es que el software primero extraiga de unas páginas objetivo todos los teléfonos que más pueda, y se espera una % de extracción de teléfonos del 90% mínimo, estas páginas son aquellas de directorios telefónicos del país como: [login to view URL], [login to view URL],[login to view URL], [login to view URL] Se debe entregar el software probado exitosamente sobre estos sitios, y extraer como minimo el 90% de los registros telefónicos. Dichos sitios corresponden a los directorios de páginas amarillas online. Se debe entregar tanto el software, no importa el lenguaje, siempre y cuando se pueda correr en Windows, como el archivo plano extraido que pruebe que funciona con el 90% minimo de telefonos extraidos de los sitios mencionados arriba. Si el proyecto es exitoso, el freelancer podra ser re contratado en el futuro, para seguir mejorando y que este software se vaya convirtiendo en un web spider especifico de telefonos.. un google, de teléfonos. Las propuestas deben ser en cantidad fija de dinero.
Se debe entregar código fuente del software.
Un cordial saludo,
Hola, cómo estás? me gustaría poder ayudarte con este proyecto. Como puedes ver en mi perfil soy un ingeniero de la Universidad de Los Andes trabajando a tiempo completo en extracción de datos web por más de dos años así que puedes estar seguro que no va haber ningún problema durante el proyecto. Para estar seguro que es posible extraer la información de todas las páginas, voy a empezar a hacer unos tests en cada una de ellas y si te contactas conmigo te puedo dar mi opinión sobre cuál es el mejor modo de completar lo que necesitas (independiente de si me elijes a mí o no, por supuesto). Espero saber pronto de uds, Gracias. Daniel
$399 USD 10日以内
4.7 (40 レビュー)
6.1
6.1
6 freelancers are bidding on average $534 USD for this job
Hello.
I read your requirement.
I have interested your project and want to work with you.
I have enough experience for this field.
If you want to know me, please see my profile.
I will do my best for your project.
Thank you
hola , tengo experiencia en sistemas web con java y php . tambien he trabajado con software de algortimos geneticos. en resumen el algortimo que desarrollaria seria el siguiente. puede ser en php o jsp. (no hay problemas con Windows) primero una pagina web con un campo de texto en donde se debe suministrar la url de la pagina a estudiar . seguida de un grupo de filtros en donde pueden aparecer fitros por categorias, ubicacion entre otros(se puede desarrollar un modulo para gestionar esta clase de informacion) luego el usuario podra enviar el formulario. internamente el algoritmo realizara el analisis de la pagina web en estudio . con la creacion de una matriz en donde almacenara los numeros telefonicos encontradados asi como su grado de aceptacion que viene siendo un puntaje de evalucion que se le agregue. este puntaje sera el resultado de la comparacion con el numero y los formatos correctos que tienen que estar previamente cargados (esto se puede gestionar ) a demas del "parecido" con los filtros . al final el sistema mostrara una tabla en html con los resultados(es decir los de mas puntaje) en donde se encontraran diversas opciones para el almacenamiento. puede ser mostrar en pdf (descargar) guardar en bd. o descargar en excel.
si desea seguir hablando del proyecto me puede enviar escribir por el chat . Saludos
Un cordial saludo, claro se puede hacer Web Scraping, tenemos experiencia en ese tipo de recurso, podemos exportar los archivos ya sea en un Excel o en un archivo sql (base de datos), como mejor lo prefieran, ustedes pueden modificar la velocidad en la que el algoritmo toma datos, y muchas cosas mas, cualquier duda o pregunta puedes hablarme al chat de freelancer, podemos debatir el precio a mi moneda local.