제목 | cURL로 긁어오기 중 Meta tag 인코딩 이슈 | ||
---|---|---|---|
글쓴이 | 쿨가이8 | 작성시각 | 2013/07/04 15:21:11 |
|
|||
안녕하세요. 현재 작업하는 소스에 URL Fetching 적용을 위해 이것저것 테스트 해보고 있는데, (사이트는 UTF-8입니다.) 유독 N모사의 블로그만 깨져서 오더군요. (일반 기사나 다른 사이트들은 다 잘 됩니다 ㅠㅠ) charset은 MS949로 되어있던데, cURL로 긁어와서 어떻게 인코딩을 해도 정확하게 안나오더라구요. 이걸로 몇일 삽질하는지 모르겠습니다 ㅠㅠ 가령 <title>TAN 의 속닥속닥 ♬ : 네이버 블로그</title> 에 해당하는 Title이 cURL로 긁어오면 아래와 같은데 [title] => TAN ÀÇ ¼Ó´Ú¼Ó´Ú ¢Ý : ³×À̹ö ºí·Î±× 당최 이걸 위에처럼 바꾸지를 못하네요;;;; 조언 좀 부탁 드립니다. |
|||
다음글 | 세션 DB사용중 useragent 문제 (1) | ||
이전글 | 긁어올것이 있는데요.. (10) | ||
변종원(웅파)
/
2013/07/04 16:48:42 /
추천
0
|
쿨가이8
/
2013/07/05 00:00:19 /
추천
0
웅파님 답변 감사 드립니다.
기본적으로 cURL로 데이터를 가져와서 인코딩하는데요. 어떤 조합으로 인코딩해도 안되더라구요;;;;; (uth-8, euc-kr, cp949 등등) 다른건 다 문제 없는데 유독 저것만 안되요 ㅠㅠ cURL로 가져올 때 저 인코딩에 맞추어서 가져와야 하나요? 가져올 때는 별도로 인코딩 세팅을 안하고 있습니다. 아 정말 어찌해야 할지 ㅠㅠ |
키
/
2013/07/05 09:54:00 /
추천
0
mb_detect_encoding 으로 가져온 인코딩 한번 확인해보시는 것도..
무슨 인코딩이길래 깨지는지 한번 보시는 것도 괜찮을듯하네요 $원문=mb_convert_encoding ( $원문,"UTF-8",mb_convert_encoding($원문)) 이런식으로도 될거구요 |
tan
/
2013/08/03 05:42:59 /
추천
0
저기요. 저 위에 TAN의 속닥속닥이라고 하는 블로그는 제 블로근데요.
제 블로그에서 어떤 글을 함부로 가지고 가시려고 하시는지는 모르겠지만 굉장히 기분 나쁘네요. 그쪽 때문에 일부러 이 사이트에 가입해서 글을 남기는건데요. 향후 제 글과 관련해서 저작권 침해가 우려되는 부분에 있어서는 그냥 보고만 있지 않을겁니다. 출판을 목적으로 쓰고 있는 글 들도 있기 때문에 함부로 긁어가려고 하는 시도 자체가 굉장히 기분 나쁩니다. 긁어가기 전에 타인의 저작권에 대해서 다시 한 번 생각해보시죠. |
utf-8로 가져와보세요.
아니면 가져와서 iconv나 nb_convert_encoding 함수 이용해서 바꿔보시구요.