[ Foro de C# ]

Leer HTML desde C#

12-Dec-2021 15:26
Danny Pid
0 Respuestas

Muy buenas,

Intento leer desde un programa en C# el HTML de una web, pero el problema que me ha surgido es que al leer la web lo hace de forma directa y sin procesar, dando un HTML que faltan datos. Necesitaría que el código que trae de vuelta sea procesado al completo, el javascript, jquery, etc.

Según he leído debe ser una lectura con WebClient de forma asíncrona, pero después de muchos intentos no consigo mi objetivo. Lo que intento es leer un perfil de Twitter, digamos que para hacer un raspado.

Adjunto el código utilizado que funciona, pero no de forma asíncrona, y no procesa la petición:

String conectar = "https://twitter.com/" + idusuario; \\ idusuario es el nombre del usuario
               var client = new WebClient();
               client.Headers.Add("User-Agent", "C# console program");
               string url = conectar;
               string content = client.DownloadString(url);
           

Este simple código accede al Twitter del usuario indicado en "idusuario", Pero como digo no trae en código procesado. He buscado en el Foro para ver si alguien tenia algún problema parecido, sin éxito. Lo mismo en Google, lo que he encontrado no funcionaba.

Se agradece la ayuda
Saludos







(No se puede continuar esta discusión porque tiene más de dos meses de antigüedad. Si tienes dudas parecidas, abre un nuevo hilo.)