제목 | 크롤링중 한글깨짐에 대해 궁금한것이 있습니다. ( 수정 2013.10.29 17:57:00 ) | ||
---|---|---|---|
글쓴이 | dataguru | 작성시각 | 2013/10/29 17:26:48 |
|
|||
지금 현제 PHP로 크롤러를 개발하고 있습니다. 그런데 테스트중 2개의 사이트를 테스트 해봣는데요 한글이 깨저서 나옴니다. 아주 간단한 문제 이긴하지만 해결이 안됩니다. 아래 이미지 첨부합니다. 크롤러 테스트 URL : http://dataguru.kr/ 테스트 URL은 아래와 같습니다. 1. http://www.cikorea.net 2. http://hogu.kr/ 1 번은 코드이그나이터 포럼 홈페이지 입니다. 2 번은 호구(hogu.kr) 페이지입니다. ( 페이지가 호구라는게 아니라 페이지 이름이 호구 입니다 ) hogu.kr 은 Codeigniter + Apache + MySQL, PHP 로 만들어 졋습니다. MySQL은 utf-8 입니다. 그런데 아래의 사진중 오른쪽을 보시면 한글이 깨져서 나옴니다. 그런데 중요한건 데이터베이스 에서 가져오는 부분만 깨져서 나온다는 것입니다. 문제점이 뭘까요?? 데이터베이스 테이블 일부분입니다. CREATE TABLE IF NOT EXISTS `comment` (
`comment_id` int(11) NOT NULL,
`post_id` int(11) NOT NULL,
`parent_id` int(11) NOT NULL DEFAULT '0' COMMENT '부모댓글 식별자\n0: 댓글\n0 < parent_id: 대댓글',
`group_id` int(11) NOT NULL DEFAULT '0' COMMENT '대댓글 그룹',
`content` text NOT NULL,
`user_id` int(11) NOT NULL DEFAULT '0' COMMENT '0: 로그인안한 사용자가 작성\n0 < user_id : 로그인한 회원이작성',
`password` varchar(255) NOT NULL,
`ip_address` varchar(16) NOT NULL,
`set_date` datetime NOT NULL,
`up_date` datetime NOT NULL,
PRIMARY KEY (`comment_id`),
KEY `fk_comment_post1_idx` (`post_id`),
KEY `set_date_idx` (`set_date`),
KEY `user_id_idx` (`user_id`),
KEY `group` (`group_id`),
KEY `group_2` (`group_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
database 설정부분입니다. MySQL 정보 부분입니다. .php 인코딩 정보 입니다. |
|||
다음글 | 브라우저 캐시삭제? (2) | ||
이전글 | 이미지 보이게 하기 (2) | ||
변종원(웅파)
/
2013/10/29 17:30:33 /
추천
0
|
dataguru
/
2013/10/29 17:51:39 /
추천
0
감사합니다 변종원님 다시 수정했습니다.
해당 뷰 파일 캐릭터셋이 euc-kr 이라는 건 .php 문서 인코딩이 euc-kr 이라는 건가요? .php 문서는 utf-8 로되어 있습니다. 이유가 뭔질 모르겟네요... |
변종원(웅파)
/
2013/10/29 18:22:31 /
추천
0
db캐릭터셋 말고 그 안에 들어 있는 데이터의 캐릭터셋을 확인해보세요.
|
dataguru
/
2013/10/29 19:39:42 /
추천
0
감사합니다. 변종원님 그부분에 대해 알아보겟습니다. |
해당 뷰 파일 캐릭터셋이 euc-kr일 수도 있습니다.
현재 정보만 가지고는 정확한 답을 얻기 힘듭니다.