파이썬 마을 게시판 인덱스 파이썬 마을
우리나라 파이썬 사용자들의 이야기 마을
 
 FAQFAQ   검색검색   멤버리스트멤버리스트   사용자 그룹사용자 그룹   사용자 등록하기사용자 등록하기 
 개인 정보개인 정보   비공개 메시지를 확인하려면 로그인하십시오비공개 메시지를 확인하려면 로그인하십시오   로그인로그인 
Google
python.or.kr Web

웹페이지의 링크 가져오기

 
글 쓰기   답변 달기    파이썬 마을 게시판 인덱스 -> 파이썬 질문과 답변
이전 주제 보기 :: 다음 주제 보기  
글쓴이 메시지
siren99



가입:
올린 글: 20

올리기올려짐: 2008 6월 24 10:14 pm    주제: 웹페이지의 링크 가져오기 인용과 함께 답변

안녕하세요?

제목보다 좀 더 어려운 문제입니다.

특정 웹페이지의 링크의 일부를 가져오고 싶습니다.

일단 그 페이지는 소스 보기가 금지되어 있습니다. Sad
페이지를 보면 여러 단어들이 있습니다. 단어들 위에 마우스를 올리면 2~3가지의 메뉴가 뜨는데 각 메뉴마다 링크가 걸려있습니다. 문제는 링크가 javascript로 되어 있습니다. 아래와 같은 식으로요.

javascript:fnSubmit('reportId=DashBoard&siteId=1096&subTitle1=abc.com')

저기서 ()안에 있는 단어들 중 특정 부분만 가져오고 싶은데 어떤 방법으로 해야할까요? 여태까지 일반 웹페이지의 텍스트만 가져오는 것을 하다가 이런걸 하게되니 엄청 헤매네요... :0

즐거운 하루되시길 바랍니다.
위로
사용자 정보 보기 비밀 메시지 보내기    
falsetru



가입:
올린 글: 2339

올리기올려짐: 2008 6월 24 10:38 pm    주제: 인용과 함께 답변

코드:
>>> import cgi
>>> link = "javascript:fnSubmit('reportId=DashBoard&siteId=1096&subTitle1=abc.com')"
>>> link.partition("'")[2].partition("'")[0]
'reportId=DashBoard&siteId=1096&subTitle1=abc.com'
>>> enc = link.partition("'")[2].partition("'")[0]
>>> cgi.parse_qs(enc)
{'subTitle1': ['abc.com'], 'siteId': ['1096'], 'reportId': ['DashBoard']}
>>> d = cgi.parse_qs(enc)
>>> d['siteId']
['1096']
위로
사용자 정보 보기 비밀 메시지 보내기    
siren99



가입:
올린 글: 20

올리기올려짐: 2008 6월 25 12:14 pm    주제: 인용과 함께 답변

답변감사드립니다.

그런데 제가 위에서 말씀드렸듯이 웹페이지가 소스보기금지가 되어 있습니다. 그리고 웹페이지가
abc.php?a=123&b=123
처럼 php이구요.

이 상태에서
javascript:fnSubmit('reportId=DashBoard&siteId=1096&subTitle1=abc.com')
이걸 어떻게 추출할 수 있을까요?

일단 추출을 해야 적어주신 코드를 적용할 수 있으니깐요... Sad

즐거운 하루되시길 바랍니다.
위로
사용자 정보 보기 비밀 메시지 보내기    
falsetru



가입:
올린 글: 2339

올리기올려짐: 2008 6월 25 12:44 pm    주제: 인용과 함께 답변

urllib 사용하세요.

코드:
>>> import urllib
>>> html = urllib.urlopen('http://python.kr').read()
>>> html[:100]
'<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">\n<html dir="ltr">\n<head>\n<meta http-e'
위로
사용자 정보 보기 비밀 메시지 보내기    
siren99



가입:
올린 글: 20

올리기올려짐: 2008 6월 25 12:47 pm    주제: 인용과 함께 답변

감사합니다 Smile

다시 이리저리 해봐야겠네요!
위로
사용자 정보 보기 비밀 메시지 보내기    
이전 글 표시:   
글 쓰기   답변 달기    파이썬 마을 게시판 인덱스 -> 파이썬 질문과 답변 시간대: GMT + 9 시간(한국)
페이지 11

 
건너뛰기:  
새로운 주제를 올릴 수 없습니다
답글을 올릴 수 없습니다
주제를 수정할 수 없습니다
올린 글을 삭제할 수 없습니다
투표를 할 수 없습니다



Powered by phpBB © 2001, 2005 phpBB Group
회선/장비: Daum DNA , 관리: 장혜식,서상현