Skip to content

생계형 개발자 수첩 ver4.0

이제 나이 먹어 강제로 4.0 버전업됨, 일인개발자임, 파키스탄식 코딩.. 오래된 코드도 다시 쓴다.

간단한 웹수집기

Posted on 2017년 4월 13일 by kimczip

웹수집기라고 하기엔 좀 그렇지만..

가장 기본이 되는 모듈이지 싶다.

원하는 웹페이지에 접속해서 원하는 정보만 뽑는..

 

using System;
using System.Net;
using HtmlAgilityPack;

class Program
{
    static void Main(string[] args)
    {
        // 첫번째 인자값 URL
        string url = args[0];

        using (WebClient wc = new WebClient())
        {
            // 옵션, 만약 URL에 파라미터가 올바르게 전달되지 않는다면 아래와 같이 명시적으로 넣어준다.
	    //wc.QueryString.Add("PARAMETER NAME", "PARAMETER VALUE");

            try
            {
                // HTML 소스 내려 받음
                string htmlSource = wc.DownloadString(url);

                if(htmlSource == string.Empty)
                {
                    Console.WriteLine("정보 없음");
                    return;
                }

                /*
                 * String 분석 보다는 Element 검색으로 빠르고 간편하게 원하는 데이터 검색
                 * TherdParty로 HtmlAgilityPack 설치
                 * 패키지 관리자 콘솔에서 : Install-Package HtmlAgilityPack 입력
                 */ 
                 
                HtmlDocument doc = new HtmlDocument();
                doc.LoadHtml(htmlSource);
                
		//찾고자 하는 노드명
                HtmlNode findNode = doc.GetElementbyId("NODE NAME");
		
		if(findNode != null)
			Console.WriteLine(findNode.InnerText);
		else
			Console.WriteLine("정보 없음");
                                    
                
            }
            catch (WebException)
            {
                Console.WriteLine("URL이 잘못되었습니다.\r\nURL : {0}", url);
            }
        }
            
    }
}
소스 보기
소스 숨김

참조 사이트 :  Html Agility Pack

Share the post "간단한 웹수집기"

  • Facebook
  • X
Posted in 3.0Tagged C#, Crawling, 개발팁, 웹수집

글 내비게이션

Thermaltake Temperature Sensor (LCD 온도센서)
커스텀 쿨링 수로 구성 2차

답글 남기기 응답 취소

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다.

버전

  • 3.0
  • 4.0

최근에..

  • 실행파일 디지털 서명하기 (프로그램 배포)
  • 자신의 PC에 막혀 있는 포트 검색
  • DB Table Column 이름 가져오기.
  • DLL 파일 PublicKeyToken 얻기
  • DSM 7.0에서 MariaDB 10 설정

Tags

10Gbps AMD Bitspower C# Command Control Corsair Crawling Exception F4-3200C14D-16GFX FLAREX G.Skill git gogs MariaDB MySQL NAS OpenCV Parallel PC-O9 rainmeter Ryzen scimitar Thermaltake UI Web WinForm 개발팁 개인사업자 광명시청 네트워크속도 데이터베이스 라이젠 랜선 랜케이블 리안리 메모리 명령프롬프트 수냉쿨링 수로 시놀로지 직구 커스텀쿨링 컴퓨터 퍼옴
Proudly powered by WordPress | Theme: micro, developed by DevriX.