Dokumen PDF yang akan dirangkum perlu dilakukan proses seleksi untuk menghilangkan beberapa bagian buku seperti title, header, footer, dan page number yang tidak terlalu penting untuk dirangkum. Proses seleksi juga dilakukan modifikasi teks seperti kalimat yang berbentuk daftar (list item) diubah menjadi paragraf.