여러 단어 경계 구분 기호를 사용하여 문자열을 단어로 분할 제가하고 싶은 일은 상당히 일반적인 작업이라고 생각하지만 웹에서 참조를 찾지 못했습니다. 구두점이있는 텍스트가 있고 단어 목록이 필요합니다. "Hey, you - what are you doing here!?" 해야한다 ['hey', 'you', 'what', 'are', 'you', 'doing', 'here'] 그러나 Python str.split()은 하나의 인수로만 작동하므로 공백으로 나눈 후 모든 단어에 구두점이 있습니다. 어떤 아이디어? 정규식이 정당화되는 경우 : import re DATA = "Hey, you - what are you doing here!?" print re.findall(r"[\w']+", DATA) # Prin..