| 이전 주제 보기 :: 다음 주제 보기 |
| 글쓴이 |
메시지 |
siren99
가입: 올린 글: 20
|
올려짐: 2008 6월 24 10:14 pm 주제: 웹페이지의 링크 가져오기 |
|
|
안녕하세요?
제목보다 좀 더 어려운 문제입니다.
특정 웹페이지의 링크의 일부를 가져오고 싶습니다.
일단 그 페이지는 소스 보기가 금지되어 있습니다.
페이지를 보면 여러 단어들이 있습니다. 단어들 위에 마우스를 올리면 2~3가지의 메뉴가 뜨는데 각 메뉴마다 링크가 걸려있습니다. 문제는 링크가 javascript로 되어 있습니다. 아래와 같은 식으로요.
javascript:fnSubmit('reportId=DashBoard&siteId=1096&subTitle1=abc.com')
저기서 ()안에 있는 단어들 중 특정 부분만 가져오고 싶은데 어떤 방법으로 해야할까요? 여태까지 일반 웹페이지의 텍스트만 가져오는 것을 하다가 이런걸 하게되니 엄청 헤매네요... :0
즐거운 하루되시길 바랍니다. |
|
| 위로 |
|
 |
falsetru
가입: 올린 글: 2339
|
올려짐: 2008 6월 24 10:38 pm 주제: |
|
|
| 코드: | >>> import cgi
>>> link = "javascript:fnSubmit('reportId=DashBoard&siteId=1096&subTitle1=abc.com')"
>>> link.partition("'")[2].partition("'")[0]
'reportId=DashBoard&siteId=1096&subTitle1=abc.com'
>>> enc = link.partition("'")[2].partition("'")[0]
>>> cgi.parse_qs(enc)
{'subTitle1': ['abc.com'], 'siteId': ['1096'], 'reportId': ['DashBoard']}
>>> d = cgi.parse_qs(enc)
>>> d['siteId']
['1096'] |
|
|
| 위로 |
|
 |
siren99
가입: 올린 글: 20
|
올려짐: 2008 6월 25 12:14 pm 주제: |
|
|
답변감사드립니다.
그런데 제가 위에서 말씀드렸듯이 웹페이지가 소스보기금지가 되어 있습니다. 그리고 웹페이지가
abc.php?a=123&b=123
처럼 php이구요.
이 상태에서
javascript:fnSubmit('reportId=DashBoard&siteId=1096&subTitle1=abc.com')
이걸 어떻게 추출할 수 있을까요?
일단 추출을 해야 적어주신 코드를 적용할 수 있으니깐요...
즐거운 하루되시길 바랍니다. |
|
| 위로 |
|
 |
falsetru
가입: 올린 글: 2339
|
올려짐: 2008 6월 25 12:44 pm 주제: |
|
|
urllib 사용하세요.
| 코드: | >>> import urllib
>>> html = urllib.urlopen('http://python.kr').read()
>>> html[:100]
'<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">\n<html dir="ltr">\n<head>\n<meta http-e' |
|
|
| 위로 |
|
 |
siren99
가입: 올린 글: 20
|
올려짐: 2008 6월 25 12:47 pm 주제: |
|
|
감사합니다
다시 이리저리 해봐야겠네요! |
|
| 위로 |
|
 |
|