Count in 1M Tokens (WSJ)

b 304 bo 2     both 631        
o 88                    
t 4655 th 140 the 65779            
h 151 he 4602     hear 54 heart 68    
e 143     ear 7     earth 38    
a 27857     art 121            
r 207                    
t 4655 th 140     than 2264        
h 151         hand 154 hands 107    
a 27857 an 4413 and 22490            
n 311 nd 6                
d 479 ds 1                
s 15889 sa 6 sat 29         saturn 1
a 27857 at 6475                
t 4655 tu 1     turn 167 turns 47    
u 2551                    
r 207                    
n 311                    
s 15889 sp 2     spin 23        
p 464 pi 1 pin 7            
i 1666 in 23251                
n 311                    
. 100000                    


next up previous
Next: Algorithmic Ideas Up: SEGMENTATION Previous: Choices