나도 코딩님의 웹크롤링을 보고 공부한 내용을 공유합니다. 웹크롤링 html 2.xpaht 3. 리퀘스트 크롬 드라이버 설치 크롬 드라이버 설치하는데 대신 나의 버전과 맞게 하고 드라이브는 같은 폴더에 저장해야 한다. f12나 개발자 도구로 영역별로 찾을 수 있다. pip install requsets로 설치한다. 1 크롤링 모듈 불러온다 2 구글의 웹 문서를 불러와서 res에 저장한다. 4 스테이트 코드는 에러가 있는지 확인한다. 문서를 가지고 오지 못하면 에러를 내서 정지시킨다. 12 res으로 가지 온 것은 text로 불러올 수 있고 그 길이를 쓸 수 있다. 13 res.txt로 가지고 와서 출력한다. 엄청나 온다. 15 가지고 온 것을 마이 구글. 에이치티 엠로 만든 것이다. 그럼 구글 화면은 가지..
옵션 4번에서 만든 것 다 집어넣어준다. 3개 옵션을 해준다. 39 이미지 통합 40~42를 스타트 함수에 있던 것 가지고 왔다 44 가로 넓이는 이미지 위드 스는 콤보 위더스에서 가지고 온다. 47 원본유지면 이미지 위드 스는 -1로 둔다. 그밖에 인트로 바꾸어서 정수형으로 저장해준다. 1024 같은 것을 인트트형으로 해준다 53 간격은 이미지 스페이스에서 선택한 값이 좁게면 30 보통이면 60 넓게면 90으로 바꾸어주고 없으면 0으로 해준다. 64 포맷은 콤보 포맷에서 받아온 값을 로우함수를 통해서 소문자로 변경한다 68은 원래 있던것이고 71 이미지 사이즈에서 -1보다 작으면 1024 같은 것들은 사이즈 변경해준다. 79 설명 보면 비율을 넓혀주려고 비율을 생각해서 분수로 해준다. 그렇게 해서 사이..
구글 서치 콘솔 등록을 해서 페이지를 누르면 각종 오류가 뜨는데요. 오류를 없애야지 방문자가 늘겠죠. 서치콘솔 에러 없애고 구글에 상위 노출 하는 방법 써봅니다. 내 글 링크에서 유알엘 검사 눌러서 들어가서 링크 넣어보면됨. 등록안되면 등록안됬다고 뜨고 등록되면 등록됬다고 뜸니다. 실제로 검색이 되는것을 볼수 있음. 근대 문제는 크롤링되고 현재 색인이 생성되지 않음, 발견은 됬지만 현재 색인이 생성되지 않은 경우다. 아니 색인이 왜 안되는거야 재신청도 한두번이지 모든글이 다 이런식이면 안되지 이런 이유는 멀까? 색인이 안된이유를 자세히 알아보기로 알아봅시다. 검사 유알엘 택스트 상자를 누르면 유알엘을 등록할수 있다고 나오기 때문에 여기서 색인생성요청을 누르면 된다. 근대 문제는 무려...29개중 23개가..
함수 만들기 2,3,4 필요한 기능을 임포트 해준다, 파일 다이얼로그를 통해서 파일을 가지고 올 수 있다. 3에 별을 써도 모든 것을 가지고 온다 했지만 서브 모듈을 가지고 온 지 않아서 명시를 해줘야 함.??..?? __all__을 안 해줘서 그럼..? 10 파일 추가 함수를 만든다. 11 파일 추가는 은 파일 다이얼로그 함수의 에스크 오픈 파일 네임을 해주고 파일 타입은 png파일, 즉 피엔지로 끝나는 * 이 별표가 피엔지로 끝나는 의미이다. 이것이 콤보 박스로 나옴. 혹은 모든 파일, *.*은 모든 파일 모든 확장자를 의미한다. 그리고 초기 위치는 인티저 디렉터리는 이미지 폴더로 해준다) 17 파일을 파일 리스트에 끝부터 넣어준다. 56 앞장에서 만든 것에서 커맨드 애드 파일을 추가한다. 23 리스..